drm/amdgpu: Modify the contiguous flags behaviour (e362b7c8) · Commits · git / linux-net

drivers/gpu/drm/amd/amdgpu/amdgpu_object.c

+7 −1

Original line number	Diff line number	Diff line
		@@ -153,8 +153,10 @@ void amdgpu_bo_placement_from_domain(struct amdgpu_bo *abo, u32 domain)
		else
		places[c].flags \|= TTM_PL_FLAG_TOPDOWN;

		if (flags & AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS)
		if (abo->tbo.type == ttm_bo_type_kernel &&
		flags & AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS)
		places[c].flags \|= TTM_PL_FLAG_CONTIGUOUS;

		c++;
		}

		@@ -967,6 +969,10 @@ int amdgpu_bo_pin_restricted(struct amdgpu_bo *bo, u32 domain,
		if (!bo->placements[i].lpfn \|\|
		(lpfn && lpfn < bo->placements[i].lpfn))
		bo->placements[i].lpfn = lpfn;

		if (bo->flags & AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS &&
		bo->placements[i].mem_type == TTM_PL_VRAM)
		bo->placements[i].flags \|= TTM_PL_FLAG_CONTIGUOUS;
		}

		r = ttm_bo_validate(&bo->tbo, &bo->placement, &ctx);

drivers/gpu/drm/amd/amdgpu/amdgpu_vram_mgr.c

+17 −6

Original line number	Diff line number	Diff line
		@@ -450,6 +450,7 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		{
		struct amdgpu_vram_mgr *mgr = to_vram_mgr(man);
		struct amdgpu_device *adev = to_amdgpu_device(mgr);
		struct amdgpu_bo *bo = ttm_to_amdgpu_bo(tbo);
		u64 vis_usage = 0, max_bytes, min_block_size;
		struct amdgpu_vram_mgr_resource *vres;
		u64 size, remaining_size, lpfn, fpfn;
		@@ -468,7 +469,7 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		if (tbo->type != ttm_bo_type_kernel)
		max_bytes -= AMDGPU_VM_RESERVED_VRAM;

		if (place->flags & TTM_PL_FLAG_CONTIGUOUS) {
		if (bo->flags & AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS) {
		pages_per_block = ~0ul;
		} else {
		#ifdef CONFIG_TRANSPARENT_HUGEPAGE
		@@ -477,7 +478,7 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		/* default to 2MB */
		pages_per_block = 2UL << (20UL - PAGE_SHIFT);
		#endif
		pages_per_block = max_t(uint32_t, pages_per_block,
		pages_per_block = max_t(u32, pages_per_block,
		tbo->page_alignment);
		}

		@@ -498,7 +499,7 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		if (place->flags & TTM_PL_FLAG_TOPDOWN)
		vres->flags \|= DRM_BUDDY_TOPDOWN_ALLOCATION;

		if (place->flags & TTM_PL_FLAG_CONTIGUOUS)
		if (bo->flags & AMDGPU_GEM_CREATE_VRAM_CONTIGUOUS)
		vres->flags \|= DRM_BUDDY_CONTIGUOUS_ALLOCATION;

		if (fpfn \|\| lpfn != mgr->mm.size)
		@@ -514,8 +515,6 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		else
		min_block_size = mgr->default_page_size;

		BUG_ON(min_block_size < mm->chunk_size);

		/* Limit maximum size to 2GiB due to SG table limitations */
		size = min(remaining_size, 2ULL << 30);

		@@ -523,12 +522,24 @@ static int amdgpu_vram_mgr_new(struct ttm_resource_manager *man,
		!(size & (((u64)pages_per_block << PAGE_SHIFT) - 1)))
		min_block_size = (u64)pages_per_block << PAGE_SHIFT;

		BUG_ON(min_block_size < mm->chunk_size);

		r = drm_buddy_alloc_blocks(mm, fpfn,
		lpfn,
		size,
		min_block_size,
		&vres->blocks,
		vres->flags);

		if (unlikely(r == -ENOSPC) && pages_per_block == ~0ul &&
		!(place->flags & TTM_PL_FLAG_CONTIGUOUS)) {
		vres->flags &= ~DRM_BUDDY_CONTIGUOUS_ALLOCATION;
		pages_per_block = max_t(u32, 2UL << (20UL - PAGE_SHIFT),
		tbo->page_alignment);

		continue;
		}

		if (unlikely(r))
		goto error_free_blocks;