drm/i915/gvt: scan non-privileged batch buffer for debug purpose (96bebe39) · Commits · e / devices / android_kernel_fairphone_FP4

drivers/gpu/drm/i915/gvt/cmd_parser.c

+42 −13

Original line number	Diff line number	Diff line
		@@ -1603,7 +1603,8 @@ static int batch_buffer_needs_scan(struct parser_exec_state *s)
		if (IS_BROADWELL(gvt->dev_priv) \|\| IS_SKYLAKE(gvt->dev_priv)
		\|\| IS_KABYLAKE(gvt->dev_priv)) {
		/* BDW decides privilege based on address space */
		if (cmd_val(s, 0) & (1 << 8))
		if (cmd_val(s, 0) & (1 << 8) &&
		!(s->vgpu->scan_nonprivbb & (1 << s->ring_id)))
		return 0;
		}
		return 1;
		@@ -1617,6 +1618,8 @@ static int find_bb_size(struct parser_exec_state s, unsigned long bb_size)
		bool bb_end = false;
		struct intel_vgpu *vgpu = s->vgpu;
		u32 cmd;
		struct intel_vgpu_mm *mm = (s->buf_addr_type == GTT_BUFFER) ?
		s->vgpu->gtt.ggtt_mm : s->workload->shadow_mm;

		*bb_size = 0;

		@@ -1628,18 +1631,22 @@ static int find_bb_size(struct parser_exec_state s, unsigned long bb_size)
		cmd = cmd_val(s, 0);
		info = get_cmd_info(s->vgpu->gvt, cmd, s->ring_id);
		if (info == NULL) {
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x\n",
		cmd, get_opcode(cmd, s->ring_id));
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x, addr_type=%s, ring %d, workload=%p\n",
		cmd, get_opcode(cmd, s->ring_id),
		(s->buf_addr_type == PPGTT_BUFFER) ?
		"ppgtt" : "ggtt", s->ring_id, s->workload);
		return -EBADRQC;
		}
		do {
		if (copy_gma_to_hva(s->vgpu, s->vgpu->gtt.ggtt_mm,
		if (copy_gma_to_hva(s->vgpu, mm,
		gma, gma + 4, &cmd) < 0)
		return -EFAULT;
		info = get_cmd_info(s->vgpu->gvt, cmd, s->ring_id);
		if (info == NULL) {
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x\n",
		cmd, get_opcode(cmd, s->ring_id));
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x, addr_type=%s, ring %d, workload=%p\n",
		cmd, get_opcode(cmd, s->ring_id),
		(s->buf_addr_type == PPGTT_BUFFER) ?
		"ppgtt" : "ggtt", s->ring_id, s->workload);
		return -EBADRQC;
		}

		@@ -1665,6 +1672,9 @@ static int perform_bb_shadow(struct parser_exec_state *s)
		unsigned long gma = 0;
		unsigned long bb_size;
		int ret = 0;
		struct intel_vgpu_mm *mm = (s->buf_addr_type == GTT_BUFFER) ?
		s->vgpu->gtt.ggtt_mm : s->workload->shadow_mm;
		unsigned long gma_start_offset = 0;

		/* get the start gm address of the batch buffer */
		gma = get_gma_bb_from_cmd(s, 1);
		@@ -1679,8 +1689,24 @@ static int perform_bb_shadow(struct parser_exec_state *s)
		if (!bb)
		return -ENOMEM;

		bb->ppgtt = (s->buf_addr_type == GTT_BUFFER) ? false : true;

		/* the gma_start_offset stores the batch buffer's start gma's
		* offset relative to page boundary. so for non-privileged batch
		* buffer, the shadowed gem object holds exactly the same page
		* layout as original gem object. This is for the convience of
		* replacing the whole non-privilged batch buffer page to this
		* shadowed one in PPGTT at the same gma address. (this replacing
		* action is not implemented yet now, but may be necessary in
		* future).
		* for prileged batch buffer, we just change start gma address to
		* that of shadowed page.
		*/
		if (bb->ppgtt)
		gma_start_offset = gma & ~I915_GTT_PAGE_MASK;

		bb->obj = i915_gem_object_create(s->vgpu->gvt->dev_priv,
		roundup(bb_size, PAGE_SIZE));
		roundup(bb_size + gma_start_offset, PAGE_SIZE));
		if (IS_ERR(bb->obj)) {
		ret = PTR_ERR(bb->obj);
		goto err_free_bb;
		@@ -1701,9 +1727,9 @@ static int perform_bb_shadow(struct parser_exec_state *s)
		bb->clflush &= ~CLFLUSH_BEFORE;
		}

		ret = copy_gma_to_hva(s->vgpu, s->vgpu->gtt.ggtt_mm,
		ret = copy_gma_to_hva(s->vgpu, mm,
		gma, gma + bb_size,
		bb->va);
		bb->va + gma_start_offset);
		if (ret < 0) {
		gvt_vgpu_err("fail to copy guest ring buffer\n");
		ret = -EFAULT;
		@@ -1729,7 +1755,7 @@ static int perform_bb_shadow(struct parser_exec_state *s)
		* buffer's gma in pair. After all, we don't want to pin the shadow
		* buffer here (too early).
		*/
		s->ip_va = bb->va;
		s->ip_va = bb->va + gma_start_offset;
		s->ip_gma = gma;
		return 0;
		err_unmap:
		@@ -2468,15 +2494,18 @@ static int cmd_parser_exec(struct parser_exec_state *s)

		info = get_cmd_info(s->vgpu->gvt, cmd, s->ring_id);
		if (info == NULL) {
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x\n",
		cmd, get_opcode(cmd, s->ring_id));
		gvt_vgpu_err("unknown cmd 0x%x, opcode=0x%x, addr_type=%s, ring %d, workload=%p\n",
		cmd, get_opcode(cmd, s->ring_id),
		(s->buf_addr_type == PPGTT_BUFFER) ?
		"ppgtt" : "ggtt", s->ring_id, s->workload);
		return -EBADRQC;
		}

		s->info = info;

		trace_gvt_command(vgpu->id, s->ring_id, s->ip_gma, s->ip_va,
		cmd_length(s), s->buf_type);
		cmd_length(s), s->buf_type, s->buf_addr_type,
		s->workload, info->name);

		if (info->handler) {
		ret = info->handler(s);

drivers/gpu/drm/i915/gvt/debugfs.c

+67 −0

Original line number	Diff line number	Diff line
		@@ -124,6 +124,68 @@ static int vgpu_mmio_diff_show(struct seq_file s, void unused)
		}
		DEFINE_SHOW_ATTRIBUTE(vgpu_mmio_diff);

		static int
		vgpu_scan_nonprivbb_get(void data, u64 val)
		{
		struct intel_vgpu vgpu = (struct intel_vgpu )data;
		*val = vgpu->scan_nonprivbb;
		return 0;
		}

		/*
		* set/unset bit engine_id of vgpu->scan_nonprivbb to turn on/off scanning
		* of non-privileged batch buffer. e.g.
		* if vgpu->scan_nonprivbb=3, then it will scan non-privileged batch buffer
		* on engine 0 and 1.
		*/
		static int
		vgpu_scan_nonprivbb_set(void *data, u64 val)
		{
		struct intel_vgpu vgpu = (struct intel_vgpu )data;
		struct drm_i915_private *dev_priv = vgpu->gvt->dev_priv;
		enum intel_engine_id id;
		char buf[128], *s;
		int len;

		val &= (1 << I915_NUM_ENGINES) - 1;

		if (vgpu->scan_nonprivbb == val)
		return 0;

		if (!val)
		goto done;

		len = sprintf(buf,
		"gvt: vgpu %d turns on non-privileged batch buffers scanning on Engines:",
		vgpu->id);

		s = buf + len;

		for (id = 0; id < I915_NUM_ENGINES; id++) {
		struct intel_engine_cs *engine;

		engine = dev_priv->engine[id];
		if (engine && (val & (1 << id))) {
		len = snprintf(s, 4, "%d, ", engine->id);
		s += len;
		} else
		val &= ~(1 << id);
		}

		if (val)
		sprintf(s, "low performance expected.");

		pr_warn("%s\n", buf);

		done:
		vgpu->scan_nonprivbb = val;
		return 0;
		}

		DEFINE_SIMPLE_ATTRIBUTE(vgpu_scan_nonprivbb_fops,
		vgpu_scan_nonprivbb_get, vgpu_scan_nonprivbb_set,
		"0x%llx\n");

		/**
		* intel_gvt_debugfs_add_vgpu - register debugfs entries for a vGPU
		* @vgpu: a vGPU
		@@ -151,6 +213,11 @@ int intel_gvt_debugfs_add_vgpu(struct intel_vgpu *vgpu)
		if (!ent)
		return -ENOMEM;

		ent = debugfs_create_file("scan_nonprivbb", 0644, vgpu->debugfs,
		vgpu, &vgpu_scan_nonprivbb_fops);
		if (!ent)
		return -ENOMEM;

		return 0;
		}

drivers/gpu/drm/i915/gvt/gvt.h

+1 −0

Original line number	Diff line number	Diff line
		@@ -226,6 +226,7 @@ struct intel_vgpu {

		struct completion vblank_done;

		u32 scan_nonprivbb;
		};

		/* validating GM healthy status*/

drivers/gpu/drm/i915/gvt/scheduler.c

+43 −21

Original line number	Diff line number	Diff line
		@@ -452,12 +452,6 @@ static int prepare_shadow_batch_buffer(struct intel_vgpu_workload *workload)
		int ret;

		list_for_each_entry(bb, &workload->shadow_bb, list) {
		bb->vma = i915_gem_object_ggtt_pin(bb->obj, NULL, 0, 0, 0);
		if (IS_ERR(bb->vma)) {
		ret = PTR_ERR(bb->vma);
		goto err;
		}

		/* For privilge batch buffer and not wa_ctx, the bb_start_cmd_va
		* is only updated into ring_scan_buffer, not real ring address
		* allocated in later copy_workload_to_ring_buffer. pls be noted
		@@ -469,6 +463,31 @@ static int prepare_shadow_batch_buffer(struct intel_vgpu_workload *workload)
		bb->bb_start_cmd_va = workload->shadow_ring_buffer_va
		+ bb->bb_offset;

		if (bb->ppgtt) {
		/* for non-priv bb, scan&shadow is only for
		* debugging purpose, so the content of shadow bb
		* is the same as original bb. Therefore,
		* here, rather than switch to shadow bb's gma
		* address, we directly use original batch buffer's
		* gma address, and send original bb to hardware
		* directly
		*/
		if (bb->clflush & CLFLUSH_AFTER) {
		drm_clflush_virt_range(bb->va,
		bb->obj->base.size);
		bb->clflush &= ~CLFLUSH_AFTER;
		}
		i915_gem_obj_finish_shmem_access(bb->obj);
		bb->accessing = false;

		} else {
		bb->vma = i915_gem_object_ggtt_pin(bb->obj,
		NULL, 0, 0, 0);
		if (IS_ERR(bb->vma)) {
		ret = PTR_ERR(bb->vma);
		goto err;
		}

		/* relocate shadow batch buffer */
		bb->bb_start_cmd_va[1] = i915_ggtt_offset(bb->vma);
		if (gmadr_bytes == 8)
		@@ -476,11 +495,13 @@ static int prepare_shadow_batch_buffer(struct intel_vgpu_workload *workload)

		/* No one is going to touch shadow bb from now on. */
		if (bb->clflush & CLFLUSH_AFTER) {
		drm_clflush_virt_range(bb->va, bb->obj->base.size);
		drm_clflush_virt_range(bb->va,
		bb->obj->base.size);
		bb->clflush &= ~CLFLUSH_AFTER;
		}

		ret = i915_gem_object_set_to_gtt_domain(bb->obj, false);
		ret = i915_gem_object_set_to_gtt_domain(bb->obj,
		false);
		if (ret)
		goto err;

		@@ -489,6 +510,7 @@ static int prepare_shadow_batch_buffer(struct intel_vgpu_workload *workload)

		i915_vma_move_to_active(bb->vma, workload->req, 0);
		}
		}
		return 0;
		err:
		release_shadow_batch_buffer(workload);

drivers/gpu/drm/i915/gvt/scheduler.h

+1 −0

Original line number	Diff line number	Diff line
		@@ -125,6 +125,7 @@ struct intel_vgpu_shadow_bb {
		unsigned int clflush;
		bool accessing;
		unsigned long bb_offset;
		bool ppgtt;
		};

		#define workload_q_head(vgpu, ring_id) \