drm/amdgpu: fix vm size and block size for VMPT (v5) (36b32a68) · Commits · e / devices / android_kernel_teracube_emerald

drivers/gpu/drm/amd/amdgpu/amdgpu_device.c

+0 −8

Original line number	Diff line number	Diff line
		@@ -1042,14 +1042,6 @@ static bool amdgpu_check_pot_argument(int arg)

		static void amdgpu_get_block_size(struct amdgpu_device *adev)
		{
		/* from AI, asic starts to support multiple level VMPT */
		if (adev->asic_type >= CHIP_VEGA10) {
		if (amdgpu_vm_block_size != 9)
		dev_warn(adev->dev,
		"Multi-VMPT limits block size to one page!\n");
		amdgpu_vm_block_size = 9;
		return;
		}
		/* defines number of bits in page table versus page directory,
		* a page is 4KB so we have 12 bits offset, minimum 9 bits in the
		* page table and the remaining bits are in the page directory */

drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c

+12 −10

Original line number	Diff line number	Diff line
		@@ -100,13 +100,14 @@ static unsigned amdgpu_vm_num_entries(struct amdgpu_device *adev,
		if (level == 0)
		/* For the root directory */
		return adev->vm_manager.max_pfn >>
		(amdgpu_vm_block_size * adev->vm_manager.num_level);
		(adev->vm_manager.block_size *
		adev->vm_manager.num_level);
		else if (level == adev->vm_manager.num_level)
		/* For the page tables on the leaves */
		return AMDGPU_VM_PTE_COUNT;
		return AMDGPU_VM_PTE_COUNT(adev);
		else
		/* Everything in between */
		return 1 << amdgpu_vm_block_size;
		return 1 << adev->vm_manager.block_size;
		}

		/**
		@@ -271,7 +272,7 @@ static int amdgpu_vm_alloc_levels(struct amdgpu_device *adev,
		unsigned level)
		{
		unsigned shift = (adev->vm_manager.num_level - level) *
		amdgpu_vm_block_size;
		adev->vm_manager.block_size;
		unsigned pt_idx, from, to;
		int r;

		@@ -976,7 +977,7 @@ static struct amdgpu_bo amdgpu_vm_get_pt(struct amdgpu_pte_update_params p,
		unsigned idx, level = p->adev->vm_manager.num_level;

		while (entry->entries) {
		idx = addr >> (amdgpu_vm_block_size * level--);
		idx = addr >> (p->adev->vm_manager.block_size * level--);
		idx %= amdgpu_bo_size(entry->bo) / 8;
		entry = &entry->entries[idx];
		}
		@@ -1003,7 +1004,8 @@ static void amdgpu_vm_update_ptes(struct amdgpu_pte_update_params *params,
		uint64_t start, uint64_t end,
		uint64_t dst, uint64_t flags)
		{
		const uint64_t mask = AMDGPU_VM_PTE_COUNT - 1;
		struct amdgpu_device *adev = params->adev;
		const uint64_t mask = AMDGPU_VM_PTE_COUNT(adev) - 1;

		uint64_t cur_pe_start, cur_nptes, cur_dst;
		uint64_t addr; /* next GPU address to be updated */
		@@ -1027,7 +1029,7 @@ static void amdgpu_vm_update_ptes(struct amdgpu_pte_update_params *params,
		if ((addr & ~mask) == (end & ~mask))
		nptes = end - addr;
		else
		nptes = AMDGPU_VM_PTE_COUNT - (addr & mask);
		nptes = AMDGPU_VM_PTE_COUNT(adev) - (addr & mask);

		cur_pe_start = amdgpu_bo_gpu_offset(pt);
		cur_pe_start += (addr & mask) * 8;
		@@ -1055,7 +1057,7 @@ static void amdgpu_vm_update_ptes(struct amdgpu_pte_update_params *params,
		if ((addr & ~mask) == (end & ~mask))
		nptes = end - addr;
		else
		nptes = AMDGPU_VM_PTE_COUNT - (addr & mask);
		nptes = AMDGPU_VM_PTE_COUNT(adev) - (addr & mask);

		next_pe_start = amdgpu_bo_gpu_offset(pt);
		next_pe_start += (addr & mask) * 8;
		@@ -1202,7 +1204,7 @@ static int amdgpu_vm_bo_update_mapping(struct amdgpu_device *adev,
		* reserve space for one command every (1 << BLOCK_SIZE)
		* entries or 2k dwords (whatever is smaller)
		*/
		ncmds = (nptes >> min(amdgpu_vm_block_size, 11)) + 1;
		ncmds = (nptes >> min(adev->vm_manager.block_size, 11u)) + 1;

		/* padding, etc. */
		ndw = 64;
		@@ -2073,7 +2075,7 @@ void amdgpu_vm_bo_invalidate(struct amdgpu_device *adev,
		int amdgpu_vm_init(struct amdgpu_device adev, struct amdgpu_vm vm)
		{
		const unsigned align = min(AMDGPU_VM_PTB_ALIGN_SIZE,
		AMDGPU_VM_PTE_COUNT * 8);
		AMDGPU_VM_PTE_COUNT(adev) * 8);
		unsigned ring_instance;
		struct amdgpu_ring *ring;
		struct amd_sched_rq *rq;

drivers/gpu/drm/amd/amdgpu/amdgpu_vm.h

+3 −1

Original line number	Diff line number	Diff line
		@@ -45,7 +45,7 @@ struct amdgpu_bo_list_entry;
		#define AMDGPU_VM_MAX_UPDATE_SIZE 0x3FFFF

		/* number of entries in page table */
		#define AMDGPU_VM_PTE_COUNT (1 << amdgpu_vm_block_size)
		#define AMDGPU_VM_PTE_COUNT(adev) (1 << (adev)->vm_manager.block_size)

		/* PTBs (Page Table Blocks) need to be aligned to 32K */
		#define AMDGPU_VM_PTB_ALIGN_SIZE 32768
		@@ -162,6 +162,8 @@ struct amdgpu_vm_manager {

		uint64_t max_pfn;
		uint32_t num_level;
		uint64_t vm_size;
		uint32_t block_size;
		/* vram base address for page table entry */
		u64 vram_base_offset;
		/* is vm enabled? */

drivers/gpu/drm/amd/amdgpu/gfxhub_v1_0.c

+1 −1

Original line number	Diff line number	Diff line
		@@ -222,7 +222,7 @@ int gfxhub_v1_0_gart_enable(struct amdgpu_device *adev)
		EXECUTE_PROTECTION_FAULT_ENABLE_DEFAULT, 1);
		tmp = REG_SET_FIELD(tmp, VM_CONTEXT1_CNTL,
		PAGE_TABLE_BLOCK_SIZE,
		amdgpu_vm_block_size - 9);
		adev->vm_manager.block_size - 9);
		WREG32(SOC15_REG_OFFSET(GC, 0, mmVM_CONTEXT1_CNTL) + i, tmp);
		WREG32(SOC15_REG_OFFSET(GC, 0, mmVM_CONTEXT1_PAGE_TABLE_START_ADDR_LO32) + i*2, 0);
		WREG32(SOC15_REG_OFFSET(GC, 0, mmVM_CONTEXT1_PAGE_TABLE_START_ADDR_HI32) + i*2, 0);

drivers/gpu/drm/amd/amdgpu/gmc_v6_0.c

+8 −2

Original line number	Diff line number	Diff line
		@@ -543,7 +543,8 @@ static int gmc_v6_0_gart_enable(struct amdgpu_device *adev)
		WREG32(mmVM_CONTEXT1_CNTL,
		VM_CONTEXT1_CNTL__ENABLE_CONTEXT_MASK \|
		(1UL << VM_CONTEXT1_CNTL__PAGE_TABLE_DEPTH__SHIFT) \|
		((amdgpu_vm_block_size - 9) << VM_CONTEXT1_CNTL__PAGE_TABLE_BLOCK_SIZE__SHIFT));
		((adev->vm_manager.block_size - 9)
		<< VM_CONTEXT1_CNTL__PAGE_TABLE_BLOCK_SIZE__SHIFT));
		if (amdgpu_vm_fault_stop == AMDGPU_VM_FAULT_STOP_ALWAYS)
		gmc_v6_0_set_fault_enable_default(adev, false);
		else
		@@ -848,7 +849,12 @@ static int gmc_v6_0_sw_init(void *handle)
		if (r)
		return r;

		adev->vm_manager.max_pfn = amdgpu_vm_size << 18;
		adev->vm_manager.vm_size = amdgpu_vm_size;
		adev->vm_manager.block_size = amdgpu_vm_block_size;
		adev->vm_manager.max_pfn = adev->vm_manager.vm_size << 18;

		DRM_INFO("vm size is %llu GB, block size is %d-bit\n",
		adev->vm_manager.vm_size, adev->vm_manager.block_size);

		adev->mc.mc_mask = 0xffffffffffULL;