drm/amdgpu: Optimize VM invalidation engine allocation and synchronize GPU TLB flush (b09cdeb4) · Commits · git / linux-net

drivers/gpu/drm/amd/amdgpu/amdgpu_gmc.c

+20 −0

Original line number	Diff line number	Diff line
		@@ -573,6 +573,7 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)
		unsigned vm_inv_engs[AMDGPU_MAX_VMHUBS] = {0};
		unsigned i;
		unsigned vmhub, inv_eng;
		struct amdgpu_ring *shared_ring;

		/* init the vm inv eng for all vmhubs */
		for_each_set_bit(i, adev->vmhubs_mask, AMDGPU_MAX_VMHUBS) {
		@@ -595,6 +596,10 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)
		ring == &adev->cper.ring_buf)
		continue;

		/* Skip if the ring is a shared ring */
		if (amdgpu_sdma_is_shared_inv_eng(adev, ring))
		continue;

		inv_eng = ffs(vm_inv_engs[vmhub]);
		if (!inv_eng) {
		dev_err(adev->dev, "no VM inv eng for ring %s\n",
		@@ -607,6 +612,21 @@ int amdgpu_gmc_allocate_vm_inv_eng(struct amdgpu_device *adev)

		dev_info(adev->dev, "ring %s uses VM inv eng %u on hub %u\n",
		ring->name, ring->vm_inv_eng, ring->vm_hub);
		/* SDMA has a special packet which allows it to use the same
		* invalidation engine for all the rings in one instance.
		* Therefore, we do not allocate a separate VM invalidation engine
		* for SDMA page rings. Instead, they share the VM invalidation
		* engine with the SDMA gfx ring. This change ensures efficient
		* resource management and avoids the issue of insufficient VM
		* invalidation engines.
		*/
		shared_ring = amdgpu_sdma_get_shared_ring(adev, ring);
		if (shared_ring) {
		shared_ring->vm_inv_eng = ring->vm_inv_eng;
		dev_info(adev->dev, "ring %s shares VM invalidation engine %u with ring %s on hub %u\n",
		ring->name, ring->vm_inv_eng, shared_ring->name, ring->vm_hub);
		continue;
		}
		}

		return 0;

drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.c

+34 −1

Original line number	Diff line number	Diff line
		@@ -504,6 +504,39 @@ void amdgpu_sdma_sysfs_reset_mask_fini(struct amdgpu_device *adev)
		}
		}

		struct amdgpu_ring amdgpu_sdma_get_shared_ring(struct amdgpu_device adev, struct amdgpu_ring *ring)
		{
		if (adev->sdma.has_page_queue &&
		(ring->me < adev->sdma.num_instances) &&
		(ring == &adev->sdma.instance[ring->me].ring))
		return &adev->sdma.instance[ring->me].page;
		else
		return NULL;
		}

		/**
		* amdgpu_sdma_is_shared_inv_eng - Check if a ring is an SDMA ring that shares a VM invalidation engine
		* @adev: Pointer to the AMDGPU device structure
		* @ring: Pointer to the ring structure to check
		*
		* This function checks if the given ring is an SDMA ring that shares a VM invalidation engine.
		* It returns true if the ring is such an SDMA ring, false otherwise.
		*/
		bool amdgpu_sdma_is_shared_inv_eng(struct amdgpu_device adev, struct amdgpu_ring ring)
		{
		int i = ring->me;

		if (!adev->sdma.has_page_queue \|\| i >= adev->sdma.num_instances)
		return false;

		if (amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 4, 3) \|\|
		amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 4, 4) \|\|
		amdgpu_ip_version(adev, GC_HWIP, 0) == IP_VERSION(9, 5, 0))
		return (ring == &adev->sdma.instance[i].page);
		else
		return false;
		}

		/**
		* amdgpu_sdma_register_on_reset_callbacks - Register SDMA reset callbacks
		* @funcs: Pointer to the callback structure containing pre_reset and post_reset functions
		@@ -544,7 +577,7 @@ int amdgpu_sdma_reset_engine(struct amdgpu_device *adev, uint32_t instance_id)
		{
		struct sdma_on_reset_funcs *funcs;
		int ret = 0;
		struct amdgpu_sdma_instance *sdma_instance = &adev->sdma.instance[instance_id];;
		struct amdgpu_sdma_instance *sdma_instance = &adev->sdma.instance[instance_id];
		struct amdgpu_ring *gfx_ring = &sdma_instance->ring;
		struct amdgpu_ring *page_ring = &sdma_instance->page;
		bool gfx_sched_stopped = false, page_sched_stopped = false;

drivers/gpu/drm/amd/amdgpu/amdgpu_sdma.h

+3 −0

Original line number	Diff line number	Diff line
		@@ -196,4 +196,7 @@ int amdgpu_sdma_ras_sw_init(struct amdgpu_device *adev);
		void amdgpu_debugfs_sdma_sched_mask_init(struct amdgpu_device *adev);
		int amdgpu_sdma_sysfs_reset_mask_init(struct amdgpu_device *adev);
		void amdgpu_sdma_sysfs_reset_mask_fini(struct amdgpu_device *adev);
		bool amdgpu_sdma_is_shared_inv_eng(struct amdgpu_device adev, struct amdgpu_ring ring);
		struct amdgpu_ring amdgpu_sdma_get_shared_ring(struct amdgpu_device adev,
		struct amdgpu_ring *ring);
		#endif