drm/amdgpu: invalidate only the currently needed VMHUB v2 (2e819849) · Commits · e / devices / android_kernel_oneplus_sm8150

drivers/gpu/drm/amd/amdgpu/amdgpu_vm.c

+1 −2

Original line number	Diff line number	Diff line
		@@ -406,8 +406,7 @@ int amdgpu_vm_grab_id(struct amdgpu_vm vm, struct amdgpu_ring ring,
		struct amdgpu_job *job)
		{
		struct amdgpu_device *adev = ring->adev;
		/* Temporary use only the first VM manager */
		unsigned vmhub = 0; /ring->funcs->vmhub;/
		unsigned vmhub = ring->funcs->vmhub;
		struct amdgpu_vm_id_manager *id_mgr = &adev->vm_manager.id_mgr[vmhub];
		uint64_t fence_context = adev->fence_context + ring->idx;
		struct dma_fence *updates = sync->last_vm_update;

drivers/gpu/drm/amd/amdgpu/gfx_v9_0.c

+15 −21

Original line number	Diff line number	Diff line
		@@ -2956,26 +2956,21 @@ static void gfx_v9_0_ring_emit_pipeline_sync(struct amdgpu_ring *ring)
		static void gfx_v9_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		unsigned vm_id, uint64_t pd_addr)
		{
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[ring->funcs->vmhub];
		int usepfp = (ring->funcs->type == AMDGPU_RING_TYPE_GFX);
		uint32_t req = ring->adev->gart.gart_funcs->get_invalidate_req(vm_id);
		unsigned eng = ring->idx;
		unsigned i;

		pd_addr = pd_addr \| 0x1; /* valid bit */
		/* now only use physical base address of PDE and valid */
		BUG_ON(pd_addr & 0xFFFF00000000003EULL);

		for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[i];

		gfx_v9_0_write_data_to_reg(ring, usepfp, true,
		hub->ctx0_ptb_addr_lo32
		+ (2 * vm_id),
		hub->ctx0_ptb_addr_lo32 + (2 * vm_id),
		lower_32_bits(pd_addr));

		gfx_v9_0_write_data_to_reg(ring, usepfp, true,
		hub->ctx0_ptb_addr_hi32
		+ (2 * vm_id),
		hub->ctx0_ptb_addr_hi32 + (2 * vm_id),
		upper_32_bits(pd_addr));

		gfx_v9_0_write_data_to_reg(ring, usepfp, true,
		@@ -2984,7 +2979,6 @@ static void gfx_v9_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		/* wait for the invalidate to complete */
		gfx_v9_0_wait_reg_mem(ring, 0, 0, 0, hub->vm_inv_eng0_ack +
		eng, 0, 1 << vm_id, 1 << vm_id, 0x20);
		}

		/* compute doesn't have PFP */
		if (usepfp) {
		@@ -3463,7 +3457,7 @@ static const struct amdgpu_ring_funcs gfx_v9_0_ring_funcs_gfx = {
		.emit_frame_size = /* totally 242 maximum if 16 IBs */
		5 + /* COND_EXEC */
		7 + /* PIPELINE_SYNC */
		46 + /* VM_FLUSH */
		24 + /* VM_FLUSH */
		8 + /* FENCE for VM_FLUSH */
		20 + /* GDS switch */
		4 + /* double SWITCH_BUFFER,
		@@ -3510,7 +3504,7 @@ static const struct amdgpu_ring_funcs gfx_v9_0_ring_funcs_compute = {
		7 + /* gfx_v9_0_ring_emit_hdp_flush */
		5 + /* gfx_v9_0_ring_emit_hdp_invalidate */
		7 + /* gfx_v9_0_ring_emit_pipeline_sync */
		64 + /* gfx_v9_0_ring_emit_vm_flush */
		24 + /* gfx_v9_0_ring_emit_vm_flush */
		8 + 8 + 8, /* gfx_v9_0_ring_emit_fence x3 for user fence, vm fence */
		.emit_ib_size = 4, /* gfx_v9_0_ring_emit_ib_compute */
		.emit_ib = gfx_v9_0_ring_emit_ib_compute,
		@@ -3540,7 +3534,7 @@ static const struct amdgpu_ring_funcs gfx_v9_0_ring_funcs_kiq = {
		7 + /* gfx_v9_0_ring_emit_hdp_flush */
		5 + /* gfx_v9_0_ring_emit_hdp_invalidate */
		7 + /* gfx_v9_0_ring_emit_pipeline_sync */
		64 + /* gfx_v9_0_ring_emit_vm_flush */
		24 + /* gfx_v9_0_ring_emit_vm_flush */
		8 + 8 + 8, /* gfx_v9_0_ring_emit_fence_kiq x3 for user fence, vm fence */
		.emit_ib_size = 4, /* gfx_v9_0_ring_emit_ib_compute */
		.emit_ib = gfx_v9_0_ring_emit_ib_compute,

drivers/gpu/drm/amd/amdgpu/sdma_v4_0.c

+28 −32

Original line number	Diff line number	Diff line
		@@ -1039,17 +1039,14 @@ static void sdma_v4_0_ring_emit_pipeline_sync(struct amdgpu_ring *ring)
		static void sdma_v4_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		unsigned vm_id, uint64_t pd_addr)
		{
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[ring->funcs->vmhub];
		uint32_t req = ring->adev->gart.gart_funcs->get_invalidate_req(vm_id);
		unsigned eng = ring->idx;
		unsigned i;

		pd_addr = pd_addr \| 0x1; /* valid bit */
		/* now only use physical base address of PDE and valid */
		BUG_ON(pd_addr & 0xFFFF00000000003EULL);

		for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[i];

		amdgpu_ring_write(ring, SDMA_PKT_HEADER_OP(SDMA_OP_SRBM_WRITE) \|
		SDMA_PKT_SRBM_WRITE_HEADER_BYTE_EN(0xf));
		amdgpu_ring_write(ring, hub->ctx0_ptb_addr_lo32 + vm_id * 2);
		@@ -1077,7 +1074,6 @@ static void sdma_v4_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		amdgpu_ring_write(ring, SDMA_PKT_POLL_REGMEM_DW5_RETRY_COUNT(0xfff) \|
		SDMA_PKT_POLL_REGMEM_DW5_INTERVAL(10));
		}
		}

		static int sdma_v4_0_early_init(void *handle)
		{
		@@ -1481,7 +1477,7 @@ static const struct amdgpu_ring_funcs sdma_v4_0_ring_funcs = {
		6 + /* sdma_v4_0_ring_emit_hdp_flush */
		3 + /* sdma_v4_0_ring_emit_hdp_invalidate */
		6 + /* sdma_v4_0_ring_emit_pipeline_sync */
		36 + /* sdma_v4_0_ring_emit_vm_flush */
		18 + /* sdma_v4_0_ring_emit_vm_flush */
		10 + 10 + 10, /* sdma_v4_0_ring_emit_fence x3 for user fence, vm fence */
		.emit_ib_size = 7 + 6, /* sdma_v4_0_ring_emit_ib */
		.emit_ib = sdma_v4_0_ring_emit_ib,

drivers/gpu/drm/amd/amdgpu/uvd_v7_0.c

+50 −61

Original line number	Diff line number	Diff line
		@@ -1034,18 +1034,15 @@ static void uvd_v7_0_vm_reg_wait(struct amdgpu_ring *ring,
		static void uvd_v7_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		unsigned vm_id, uint64_t pd_addr)
		{
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[ring->funcs->vmhub];
		uint32_t req = ring->adev->gart.gart_funcs->get_invalidate_req(vm_id);
		uint32_t data0, data1, mask;
		unsigned eng = ring->idx;
		unsigned i;

		pd_addr = pd_addr \| 0x1; /* valid bit */
		/* now only use physical base address of PDE and valid */
		BUG_ON(pd_addr & 0xFFFF00000000003EULL);

		for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[i];

		data0 = (hub->ctx0_ptb_addr_hi32 + vm_id * 2) << 2;
		data1 = upper_32_bits(pd_addr);
		uvd_v7_0_vm_reg_write(ring, data0, data1);
		@@ -1070,7 +1067,6 @@ static void uvd_v7_0_ring_emit_vm_flush(struct amdgpu_ring *ring,
		mask = 1 << vm_id;
		uvd_v7_0_vm_reg_wait(ring, data0, data1, mask);
		}
		}

		static void uvd_v7_0_enc_ring_insert_end(struct amdgpu_ring *ring)
		{
		@@ -1080,30 +1076,24 @@ static void uvd_v7_0_enc_ring_insert_end(struct amdgpu_ring *ring)
		static void uvd_v7_0_enc_ring_emit_vm_flush(struct amdgpu_ring *ring,
		unsigned int vm_id, uint64_t pd_addr)
		{
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[ring->funcs->vmhub];
		uint32_t req = ring->adev->gart.gart_funcs->get_invalidate_req(vm_id);
		unsigned eng = ring->idx;
		unsigned i;

		pd_addr = pd_addr \| 0x1; /* valid bit */
		/* now only use physical base address of PDE and valid */
		BUG_ON(pd_addr & 0xFFFF00000000003EULL);

		for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[i];

		amdgpu_ring_write(ring, HEVC_ENC_CMD_REG_WRITE);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_hi32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_hi32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, upper_32_bits(pd_addr));

		amdgpu_ring_write(ring, HEVC_ENC_CMD_REG_WRITE);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, lower_32_bits(pd_addr));

		amdgpu_ring_write(ring, HEVC_ENC_CMD_REG_WAIT);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, 0xffffffff);
		amdgpu_ring_write(ring, lower_32_bits(pd_addr));

		@@ -1118,7 +1108,6 @@ static void uvd_v7_0_enc_ring_emit_vm_flush(struct amdgpu_ring *ring,
		amdgpu_ring_write(ring, 1 << vm_id);
		amdgpu_ring_write(ring, 1 << vm_id);
		}
		}

		#if 0
		static bool uvd_v7_0_is_idle(void *handle)
		@@ -1455,7 +1444,7 @@ static const struct amdgpu_ring_funcs uvd_v7_0_ring_vm_funcs = {
		.emit_frame_size =
		2 + /* uvd_v7_0_ring_emit_hdp_flush */
		2 + /* uvd_v7_0_ring_emit_hdp_invalidate */
		34 * AMDGPU_MAX_VMHUBS + /* uvd_v7_0_ring_emit_vm_flush */
		34 + /* uvd_v7_0_ring_emit_vm_flush */
		14 + 14, /* uvd_v7_0_ring_emit_fence x2 vm fence */
		.emit_ib_size = 8, /* uvd_v7_0_ring_emit_ib */
		.emit_ib = uvd_v7_0_ring_emit_ib,
		@@ -1481,7 +1470,7 @@ static const struct amdgpu_ring_funcs uvd_v7_0_enc_ring_vm_funcs = {
		.get_wptr = uvd_v7_0_enc_ring_get_wptr,
		.set_wptr = uvd_v7_0_enc_ring_set_wptr,
		.emit_frame_size =
		17 * AMDGPU_MAX_VMHUBS + /* uvd_v7_0_enc_ring_emit_vm_flush */
		17 + /* uvd_v7_0_enc_ring_emit_vm_flush */
		5 + 5 + /* uvd_v7_0_enc_ring_emit_fence x2 vm fence */
		1, /* uvd_v7_0_enc_ring_insert_end */
		.emit_ib_size = 5, /* uvd_v7_0_enc_ring_emit_ib */

drivers/gpu/drm/amd/amdgpu/vce_v4_0.c

+25 −32

Original line number	Diff line number	Diff line
		@@ -968,30 +968,24 @@ static void vce_v4_0_ring_insert_end(struct amdgpu_ring *ring)
		static void vce_v4_0_emit_vm_flush(struct amdgpu_ring *ring,
		unsigned int vm_id, uint64_t pd_addr)
		{
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[ring->funcs->vmhub];
		uint32_t req = ring->adev->gart.gart_funcs->get_invalidate_req(vm_id);
		unsigned eng = ring->idx;
		unsigned i;

		pd_addr = pd_addr \| 0x1; /* valid bit */
		/* now only use physical base address of PDE and valid */
		BUG_ON(pd_addr & 0xFFFF00000000003EULL);

		for (i = 0; i < AMDGPU_MAX_VMHUBS; ++i) {
		struct amdgpu_vmhub *hub = &ring->adev->vmhub[i];

		amdgpu_ring_write(ring, VCE_CMD_REG_WRITE);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_hi32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_hi32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, upper_32_bits(pd_addr));

		amdgpu_ring_write(ring, VCE_CMD_REG_WRITE);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, lower_32_bits(pd_addr));

		amdgpu_ring_write(ring, VCE_CMD_REG_WAIT);
		amdgpu_ring_write(ring,
		(hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, (hub->ctx0_ptb_addr_lo32 + vm_id * 2) << 2);
		amdgpu_ring_write(ring, 0xffffffff);
		amdgpu_ring_write(ring, lower_32_bits(pd_addr));

		@@ -1006,7 +1000,6 @@ static void vce_v4_0_emit_vm_flush(struct amdgpu_ring *ring,
		amdgpu_ring_write(ring, 1 << vm_id);
		amdgpu_ring_write(ring, 1 << vm_id);
		}
		}

		static int vce_v4_0_set_interrupt_state(struct amdgpu_device *adev,
		struct amdgpu_irq_src *source,
		@@ -1079,7 +1072,7 @@ static const struct amdgpu_ring_funcs vce_v4_0_ring_vm_funcs = {
		.set_wptr = vce_v4_0_ring_set_wptr,
		.parse_cs = amdgpu_vce_ring_parse_cs_vm,
		.emit_frame_size =
		17 * AMDGPU_MAX_VMHUBS + /* vce_v4_0_emit_vm_flush */
		17 + /* vce_v4_0_emit_vm_flush */
		5 + 5 + /* amdgpu_vce_ring_emit_fence x2 vm fence */
		1, /* vce_v4_0_ring_insert_end */
		.emit_ib_size = 5, /* vce_v4_0_ring_emit_ib */