drm/amdgpu: move context switch handling into common code v2 (f153d286) · Commits · e / devices / android_kernel_teracube_emerald

drivers/gpu/drm/amd/amdgpu/amdgpu.h

+2 −2

Original line number	Diff line number	Diff line
		@@ -283,7 +283,7 @@ struct amdgpu_ring_funcs {
		int (parse_cs)(struct amdgpu_cs_parser p, uint32_t ib_idx);
		/* command emit functions */
		void (emit_ib)(struct amdgpu_ring ring,
		struct amdgpu_ib *ib);
		struct amdgpu_ib *ib, bool ctx_switch);
		void (emit_fence)(struct amdgpu_ring ring, uint64_t addr,
		uint64_t seq, unsigned flags);
		void (emit_pipeline_sync)(struct amdgpu_ring ring);
		@@ -2221,7 +2221,7 @@ amdgpu_get_sdma_instance(struct amdgpu_ring *ring)
		#define amdgpu_ring_get_rptr(r) (r)->funcs->get_rptr((r))
		#define amdgpu_ring_get_wptr(r) (r)->funcs->get_wptr((r))
		#define amdgpu_ring_set_wptr(r) (r)->funcs->set_wptr((r))
		#define amdgpu_ring_emit_ib(r, ib) (r)->funcs->emit_ib((r), (ib))
		#define amdgpu_ring_emit_ib(r, ib, c) (r)->funcs->emit_ib((r), (ib), (c))
		#define amdgpu_ring_emit_pipeline_sync(r) (r)->funcs->emit_pipeline_sync((r))
		#define amdgpu_ring_emit_vm_flush(r, vmid, addr) (r)->funcs->emit_vm_flush((r), (vmid), (addr))
		#define amdgpu_ring_emit_fence(r, addr, seq, flags) (r)->funcs->emit_fence((r), (addr), (seq), (flags))

drivers/gpu/drm/amd/amdgpu/amdgpu_ib.c

+7 −9

Original line number	Diff line number	Diff line
		@@ -121,18 +121,16 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
		{
		struct amdgpu_device *adev = ring->adev;
		struct amdgpu_ib *ib = &ibs[0];
		uint64_t ctx, old_ctx;
		struct fence *hwf;
		struct amdgpu_vm *vm = NULL;
		unsigned i, patch_offset = ~0;
		bool skip_preamble;
		bool skip_preamble, need_ctx_switch;

		int r = 0;

		if (num_ibs == 0)
		return -EINVAL;

		ctx = ibs->ctx;
		if (job) /* for domain0 job like ring test, ibs->job is not assigned */
		vm = job->vm;

		@@ -156,7 +154,6 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
		patch_offset = amdgpu_ring_init_cond_exec(ring);

		if (vm) {
		/* do context switch */
		r = amdgpu_vm_flush(ring, ib->vm_id, ib->vm_pd_addr,
		ib->gds_base, ib->gds_size,
		ib->gws_base, ib->gws_size,
		@@ -173,16 +170,17 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
		/* always set cond_exec_polling to CONTINUE */
		*ring->cond_exe_cpu_addr = 1;

		skip_preamble = ring->current_ctx == ctx;
		old_ctx = ring->current_ctx;
		skip_preamble = ring->current_ctx == ib->ctx;
		need_ctx_switch = ring->current_ctx != ib->ctx;
		for (i = 0; i < num_ibs; ++i) {
		ib = &ibs[i];

		/* drop preamble IBs if we don't have a context switch */
		if ((ib->flags & AMDGPU_IB_FLAG_PREAMBLE) && skip_preamble)
		continue;

		amdgpu_ring_emit_ib(ring, ib);
		ring->current_ctx = ctx;
		amdgpu_ring_emit_ib(ring, ib, need_ctx_switch);
		need_ctx_switch = false;
		}

		if (ring->funcs->emit_hdp_invalidate)
		@@ -191,7 +189,6 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
		r = amdgpu_fence_emit(ring, &hwf);
		if (r) {
		dev_err(adev->dev, "failed to emit fence (%d)\n", r);
		ring->current_ctx = old_ctx;
		if (ib->vm_id)
		amdgpu_vm_reset_id(adev, ib->vm_id);
		amdgpu_ring_undo(ring);
		@@ -212,6 +209,7 @@ int amdgpu_ib_schedule(struct amdgpu_ring *ring, unsigned num_ibs,
		if (patch_offset != ~0 && ring->funcs->patch_cond_exec)
		amdgpu_ring_patch_cond_exec(ring, patch_offset);

		ring->current_ctx = ibs->ctx;
		amdgpu_ring_commit(ring);
		return 0;
		}

drivers/gpu/drm/amd/amdgpu/amdgpu_vce.c

+1 −1

Original line number	Diff line number	Diff line
		@@ -762,7 +762,7 @@ int amdgpu_vce_ring_parse_cs(struct amdgpu_cs_parser *p, uint32_t ib_idx)
		* @ib: the IB to execute
		*
		*/
		void amdgpu_vce_ring_emit_ib(struct amdgpu_ring ring, struct amdgpu_ib ib)
		void amdgpu_vce_ring_emit_ib(struct amdgpu_ring ring, struct amdgpu_ib ib, bool ctx_switch)
		{
		amdgpu_ring_write(ring, VCE_CMD_IB);
		amdgpu_ring_write(ring, lower_32_bits(ib->gpu_addr));

drivers/gpu/drm/amd/amdgpu/amdgpu_vce.h

+1 −1

Original line number	Diff line number	Diff line
		@@ -34,7 +34,7 @@ int amdgpu_vce_get_destroy_msg(struct amdgpu_ring *ring, uint32_t handle,
		bool direct, struct fence **fence);
		void amdgpu_vce_free_handles(struct amdgpu_device adev, struct drm_file filp);
		int amdgpu_vce_ring_parse_cs(struct amdgpu_cs_parser *p, uint32_t ib_idx);
		void amdgpu_vce_ring_emit_ib(struct amdgpu_ring ring, struct amdgpu_ib ib);
		void amdgpu_vce_ring_emit_ib(struct amdgpu_ring ring, struct amdgpu_ib ib, bool ctx_switch);
		void amdgpu_vce_ring_emit_fence(struct amdgpu_ring *ring, u64 addr, u64 seq,
		unsigned flags);
		int amdgpu_vce_ring_test_ring(struct amdgpu_ring *ring);

drivers/gpu/drm/amd/amdgpu/cik_sdma.c

+1 −1

Original line number	Diff line number	Diff line
		@@ -210,7 +210,7 @@ static void cik_sdma_ring_insert_nop(struct amdgpu_ring *ring, uint32_t count)
		* Schedule an IB in the DMA ring (CIK).
		*/
		static void cik_sdma_ring_emit_ib(struct amdgpu_ring *ring,
		struct amdgpu_ib *ib)
		struct amdgpu_ib *ib, bool ctx_switch)
		{
		u32 extra_bits = ib->vm_id & 0xf;
		u32 next_rptr = ring->wptr + 5;