scripts/python/parallel-perf.py

e0c48bf9SAdrian Hunter#!/usr/bin/env python3
e0c48bf9SAdrian Hunter# SPDX-License-Identifier: GPL-2.0
e0c48bf9SAdrian Hunter#
e0c48bf9SAdrian Hunter# Run a perf script command multiple times in parallel, using perf script
e0c48bf9SAdrian Hunter# options --cpu and --time so that each job processes a different chunk
e0c48bf9SAdrian Hunter# of the data.
e0c48bf9SAdrian Hunter#
e0c48bf9SAdrian Hunter# Copyright (c) 2024, Intel Corporation.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterimport subprocess
e0c48bf9SAdrian Hunterimport argparse
e0c48bf9SAdrian Hunterimport pathlib
e0c48bf9SAdrian Hunterimport shlex
e0c48bf9SAdrian Hunterimport time
e0c48bf9SAdrian Hunterimport copy
e0c48bf9SAdrian Hunterimport sys
e0c48bf9SAdrian Hunterimport os
e0c48bf9SAdrian Hunterimport re
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterglb_prog_name = "parallel-perf.py"
e0c48bf9SAdrian Hunterglb_min_interval = 10.0
e0c48bf9SAdrian Hunterglb_min_samples = 64
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterclass Verbosity():
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def __init__(self, quiet=False, verbose=False, debug=False):
e0c48bf9SAdrian Hunter		self.normal    = True
e0c48bf9SAdrian Hunter		self.verbose   = verbose
e0c48bf9SAdrian Hunter		self.debug     = debug
e0c48bf9SAdrian Hunter		self.self_test = True
e0c48bf9SAdrian Hunter		if self.debug:
e0c48bf9SAdrian Hunter			self.verbose = True
e0c48bf9SAdrian Hunter		if self.verbose:
e0c48bf9SAdrian Hunter			quiet = False
e0c48bf9SAdrian Hunter		if quiet:
e0c48bf9SAdrian Hunter			self.normal = False
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter# Manage work (Start/Wait/Kill), as represented by a subprocess.Popen command
e0c48bf9SAdrian Hunterclass Work():
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def __init__(self, cmd, pipe_to, output_dir="."):
e0c48bf9SAdrian Hunter		self.popen = None
e0c48bf9SAdrian Hunter		self.consumer = None
e0c48bf9SAdrian Hunter		self.cmd = cmd
e0c48bf9SAdrian Hunter		self.pipe_to = pipe_to
e0c48bf9SAdrian Hunter		self.output_dir = output_dir
e0c48bf9SAdrian Hunter		self.cmdout_name = f"{output_dir}/cmd.txt"
e0c48bf9SAdrian Hunter		self.stdout_name = f"{output_dir}/out.txt"
e0c48bf9SAdrian Hunter		self.stderr_name = f"{output_dir}/err.txt"
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Command(self):
e0c48bf9SAdrian Hunter		sh_cmd = [ shlex.quote(x) for x in self.cmd ]
e0c48bf9SAdrian Hunter		return " ".join(self.cmd)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Stdout(self):
e0c48bf9SAdrian Hunter		return open(self.stdout_name, "w")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Stderr(self):
e0c48bf9SAdrian Hunter		return open(self.stderr_name, "w")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def CreateOutputDir(self):
e0c48bf9SAdrian Hunter		pathlib.Path(self.output_dir).mkdir(parents=True, exist_ok=True)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Start(self):
e0c48bf9SAdrian Hunter		if self.popen:
e0c48bf9SAdrian Hunter			return
e0c48bf9SAdrian Hunter		self.CreateOutputDir()
e0c48bf9SAdrian Hunter		with open(self.cmdout_name, "w") as f:
e0c48bf9SAdrian Hunter			f.write(self.Command())
e0c48bf9SAdrian Hunter			f.write("\n")
e0c48bf9SAdrian Hunter		stdout = self.Stdout()
e0c48bf9SAdrian Hunter		stderr = self.Stderr()
e0c48bf9SAdrian Hunter		if self.pipe_to:
e0c48bf9SAdrian Hunter			self.popen = subprocess.Popen(self.cmd, stdout=subprocess.PIPE, stderr=stderr)
e0c48bf9SAdrian Hunter			args = shlex.split(self.pipe_to)
e0c48bf9SAdrian Hunter			self.consumer = subprocess.Popen(args, stdin=self.popen.stdout, stdout=stdout, stderr=stderr)
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			self.popen = subprocess.Popen(self.cmd, stdout=stdout, stderr=stderr)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def RemoveEmptyErrFile(self):
e0c48bf9SAdrian Hunter		if os.path.exists(self.stderr_name):
e0c48bf9SAdrian Hunter			if os.path.getsize(self.stderr_name) == 0:
e0c48bf9SAdrian Hunter				os.unlink(self.stderr_name)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Errors(self):
e0c48bf9SAdrian Hunter		if os.path.exists(self.stderr_name):
e0c48bf9SAdrian Hunter			if os.path.getsize(self.stderr_name) != 0:
e0c48bf9SAdrian Hunter				return [ f"Non-empty error file {self.stderr_name}" ]
e0c48bf9SAdrian Hunter		return []
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def TidyUp(self):
e0c48bf9SAdrian Hunter		self.RemoveEmptyErrFile()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def RawPollWait(self, p, wait):
e0c48bf9SAdrian Hunter		if wait:
e0c48bf9SAdrian Hunter			return p.wait()
e0c48bf9SAdrian Hunter		return p.poll()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Poll(self, wait=False):
e0c48bf9SAdrian Hunter		if not self.popen:
e0c48bf9SAdrian Hunter			return None
e0c48bf9SAdrian Hunter		result = self.RawPollWait(self.popen, wait)
e0c48bf9SAdrian Hunter		if self.consumer:
e0c48bf9SAdrian Hunter			res = result
e0c48bf9SAdrian Hunter			result = self.RawPollWait(self.consumer, wait)
e0c48bf9SAdrian Hunter			if result != None and res == None:
e0c48bf9SAdrian Hunter				self.popen.kill()
e0c48bf9SAdrian Hunter				result = None
e0c48bf9SAdrian Hunter			elif result == 0 and res != None and res != 0:
e0c48bf9SAdrian Hunter				result = res
e0c48bf9SAdrian Hunter		if result != None:
e0c48bf9SAdrian Hunter			self.TidyUp()
e0c48bf9SAdrian Hunter		return result
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Wait(self):
e0c48bf9SAdrian Hunter		return self.Poll(wait=True)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Kill(self):
e0c48bf9SAdrian Hunter		if not self.popen:
e0c48bf9SAdrian Hunter			return
e0c48bf9SAdrian Hunter		self.popen.kill()
e0c48bf9SAdrian Hunter		if self.consumer:
e0c48bf9SAdrian Hunter			self.consumer.kill()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef KillWork(worklist, verbosity):
e0c48bf9SAdrian Hunter	for w in worklist:
e0c48bf9SAdrian Hunter		w.Kill()
e0c48bf9SAdrian Hunter	for w in worklist:
e0c48bf9SAdrian Hunter		w.Wait()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef NumberOfCPUs():
e0c48bf9SAdrian Hunter	return os.sysconf("SC_NPROCESSORS_ONLN")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef NanoSecsToSecsStr(x):
e0c48bf9SAdrian Hunter	if x == None:
e0c48bf9SAdrian Hunter		return ""
e0c48bf9SAdrian Hunter	x = str(x)
e0c48bf9SAdrian Hunter	if len(x) < 10:
e0c48bf9SAdrian Hunter		x = "0" * (10 - len(x)) + x
e0c48bf9SAdrian Hunter	return x[:len(x) - 9] + "." + x[-9:]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef InsertOptionAfter(cmd, option, after):
e0c48bf9SAdrian Hunter	try:
e0c48bf9SAdrian Hunter		pos = cmd.index(after)
e0c48bf9SAdrian Hunter		cmd.insert(pos + 1, option)
e0c48bf9SAdrian Hunter	except:
e0c48bf9SAdrian Hunter		cmd.append(option)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef CreateWorkList(cmd, pipe_to, output_dir, cpus, time_ranges_by_cpu):
e0c48bf9SAdrian Hunter	max_len = len(str(cpus[-1]))
e0c48bf9SAdrian Hunter	cpu_dir_fmt = f"cpu-%.{max_len}u"
e0c48bf9SAdrian Hunter	worklist = []
e0c48bf9SAdrian Hunter	pos = 0
e0c48bf9SAdrian Hunter	for cpu in cpus:
e0c48bf9SAdrian Hunter		if cpu >= 0:
e0c48bf9SAdrian Hunter			cpu_dir = os.path.join(output_dir, cpu_dir_fmt % cpu)
e0c48bf9SAdrian Hunter			cpu_option = f"--cpu={cpu}"
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			cpu_dir = output_dir
e0c48bf9SAdrian Hunter			cpu_option = None
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter		tr_dir_fmt = "time-range"
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter		if len(time_ranges_by_cpu) > 1:
e0c48bf9SAdrian Hunter			time_ranges = time_ranges_by_cpu[pos]
e0c48bf9SAdrian Hunter			tr_dir_fmt += f"-{pos}"
e0c48bf9SAdrian Hunter			pos += 1
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			time_ranges = time_ranges_by_cpu[0]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter		max_len = len(str(len(time_ranges)))
e0c48bf9SAdrian Hunter		tr_dir_fmt += f"-%.{max_len}u"
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter		i = 0
e0c48bf9SAdrian Hunter		for r in time_ranges:
e0c48bf9SAdrian Hunter			if r == [None, None]:
e0c48bf9SAdrian Hunter				time_option = None
e0c48bf9SAdrian Hunter				work_output_dir = cpu_dir
e0c48bf9SAdrian Hunter			else:
e0c48bf9SAdrian Hunter				time_option = "--time=" + NanoSecsToSecsStr(r[0]) + "," + NanoSecsToSecsStr(r[1])
e0c48bf9SAdrian Hunter				work_output_dir = os.path.join(cpu_dir, tr_dir_fmt % i)
e0c48bf9SAdrian Hunter				i += 1
e0c48bf9SAdrian Hunter			work_cmd = list(cmd)
e0c48bf9SAdrian Hunter			if time_option != None:
e0c48bf9SAdrian Hunter				InsertOptionAfter(work_cmd, time_option, "script")
e0c48bf9SAdrian Hunter			if cpu_option != None:
e0c48bf9SAdrian Hunter				InsertOptionAfter(work_cmd, cpu_option, "script")
e0c48bf9SAdrian Hunter			w = Work(work_cmd, pipe_to, work_output_dir)
e0c48bf9SAdrian Hunter			worklist.append(w)
e0c48bf9SAdrian Hunter	return worklist
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef DoRunWork(worklist, nr_jobs, verbosity):
e0c48bf9SAdrian Hunter	nr_to_do = len(worklist)
e0c48bf9SAdrian Hunter	not_started = list(worklist)
e0c48bf9SAdrian Hunter	running = []
e0c48bf9SAdrian Hunter	done = []
e0c48bf9SAdrian Hunter	chg = False
e0c48bf9SAdrian Hunter	while True:
e0c48bf9SAdrian Hunter		nr_done = len(done)
e0c48bf9SAdrian Hunter		if chg and verbosity.normal:
e0c48bf9SAdrian Hunter			nr_run = len(running)
e0c48bf9SAdrian Hunter			print(f"\rThere are {nr_to_do} jobs: {nr_done} completed, {nr_run} running", flush=True, end=" ")
e0c48bf9SAdrian Hunter			if verbosity.verbose:
e0c48bf9SAdrian Hunter				print()
e0c48bf9SAdrian Hunter			chg = False
e0c48bf9SAdrian Hunter		if nr_done == nr_to_do:
e0c48bf9SAdrian Hunter			break
e0c48bf9SAdrian Hunter		while len(running) < nr_jobs and len(not_started):
e0c48bf9SAdrian Hunter			w = not_started.pop(0)
e0c48bf9SAdrian Hunter			running.append(w)
e0c48bf9SAdrian Hunter			if verbosity.verbose:
e0c48bf9SAdrian Hunter				print("Starting:", w.Command())
e0c48bf9SAdrian Hunter			w.Start()
e0c48bf9SAdrian Hunter			chg = True
e0c48bf9SAdrian Hunter		if len(running):
e0c48bf9SAdrian Hunter			time.sleep(0.1)
e0c48bf9SAdrian Hunter		finished = []
e0c48bf9SAdrian Hunter		not_finished = []
e0c48bf9SAdrian Hunter		while len(running):
e0c48bf9SAdrian Hunter			w = running.pop(0)
e0c48bf9SAdrian Hunter			r = w.Poll()
e0c48bf9SAdrian Hunter			if r == None:
e0c48bf9SAdrian Hunter				not_finished.append(w)
e0c48bf9SAdrian Hunter				continue
e0c48bf9SAdrian Hunter			if r == 0:
e0c48bf9SAdrian Hunter				if verbosity.verbose:
e0c48bf9SAdrian Hunter					print("Finished:", w.Command())
e0c48bf9SAdrian Hunter				finished.append(w)
e0c48bf9SAdrian Hunter				chg = True
e0c48bf9SAdrian Hunter				continue
e0c48bf9SAdrian Hunter			if verbosity.normal and not verbosity.verbose:
e0c48bf9SAdrian Hunter				print()
e0c48bf9SAdrian Hunter			print("Job failed!\n    return code:", r, "\n    command:    ", w.Command())
e0c48bf9SAdrian Hunter			if w.pipe_to:
e0c48bf9SAdrian Hunter				print("    piped to:   ", w.pipe_to)
e0c48bf9SAdrian Hunter			print("Killing outstanding jobs")
e0c48bf9SAdrian Hunter			KillWork(not_finished, verbosity)
e0c48bf9SAdrian Hunter			KillWork(running, verbosity)
e0c48bf9SAdrian Hunter			return False
e0c48bf9SAdrian Hunter		running = not_finished
e0c48bf9SAdrian Hunter		done += finished
e0c48bf9SAdrian Hunter	errorlist = []
e0c48bf9SAdrian Hunter	for w in worklist:
e0c48bf9SAdrian Hunter		errorlist += w.Errors()
e0c48bf9SAdrian Hunter	if len(errorlist):
e0c48bf9SAdrian Hunter		print("Errors:")
e0c48bf9SAdrian Hunter		for e in errorlist:
e0c48bf9SAdrian Hunter			print(e)
e0c48bf9SAdrian Hunter	elif verbosity.normal:
e0c48bf9SAdrian Hunter		print("\r"," "*50, "\rAll jobs finished successfully", flush=True)
e0c48bf9SAdrian Hunter	return True
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef RunWork(worklist, nr_jobs=NumberOfCPUs(), verbosity=Verbosity()):
e0c48bf9SAdrian Hunter	try:
e0c48bf9SAdrian Hunter		return DoRunWork(worklist, nr_jobs, verbosity)
e0c48bf9SAdrian Hunter	except:
e0c48bf9SAdrian Hunter		for w in worklist:
e0c48bf9SAdrian Hunter			w.Kill()
e0c48bf9SAdrian Hunter		raise
e0c48bf9SAdrian Hunter	return True
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ReadHeader(perf, file_name):
e0c48bf9SAdrian Hunter	return subprocess.Popen([perf, "script", "--header-only", "--input", file_name], stdout=subprocess.PIPE).stdout.read().decode("utf-8")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ParseHeader(hdr):
e0c48bf9SAdrian Hunter	result = {}
e0c48bf9SAdrian Hunter	lines = hdr.split("\n")
e0c48bf9SAdrian Hunter	for line in lines:
e0c48bf9SAdrian Hunter		if ":" in line and line[0] == "#":
e0c48bf9SAdrian Hunter			pos = line.index(":")
e0c48bf9SAdrian Hunter			name = line[1:pos-1].strip()
e0c48bf9SAdrian Hunter			value = line[pos+1:].strip()
e0c48bf9SAdrian Hunter			if name in result:
e0c48bf9SAdrian Hunter				orig_name = name
e0c48bf9SAdrian Hunter				nr = 2
e0c48bf9SAdrian Hunter				while True:
e0c48bf9SAdrian Hunter					name = f"{orig_name} {nr}"
e0c48bf9SAdrian Hunter					if name not in result:
e0c48bf9SAdrian Hunter						break
e0c48bf9SAdrian Hunter					nr += 1
e0c48bf9SAdrian Hunter			result[name] = value
e0c48bf9SAdrian Hunter	return result
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef HeaderField(hdr_dict, hdr_fld):
e0c48bf9SAdrian Hunter	if hdr_fld not in hdr_dict:
e0c48bf9SAdrian Hunter		raise Exception(f"'{hdr_fld}' missing from header information")
e0c48bf9SAdrian Hunter	return hdr_dict[hdr_fld]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter# Represent the position of an option within a command string
e0c48bf9SAdrian Hunter# and provide the option value and/or remove the option
e0c48bf9SAdrian Hunterclass OptPos():
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Init(self, opt_element=-1, value_element=-1, opt_pos=-1, value_pos=-1, error=None):
e0c48bf9SAdrian Hunter		self.opt_element = opt_element		# list element that contains option
e0c48bf9SAdrian Hunter		self.value_element = value_element	# list element that contains option value
e0c48bf9SAdrian Hunter		self.opt_pos = opt_pos			# string position of option
e0c48bf9SAdrian Hunter		self.value_pos = value_pos		# string position of value
e0c48bf9SAdrian Hunter		self.error = error			# error message string
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def __init__(self, args, short_name, long_name, default=None):
e0c48bf9SAdrian Hunter		self.args = list(args)
e0c48bf9SAdrian Hunter		self.default = default
e0c48bf9SAdrian Hunter		n = 2 + len(long_name)
e0c48bf9SAdrian Hunter		m = len(short_name)
e0c48bf9SAdrian Hunter		pos = -1
e0c48bf9SAdrian Hunter		for opt in args:
e0c48bf9SAdrian Hunter			pos += 1
e0c48bf9SAdrian Hunter			if m and opt[:2] == f"-{short_name}":
e0c48bf9SAdrian Hunter				if len(opt) == 2:
e0c48bf9SAdrian Hunter					if pos + 1 < len(args):
e0c48bf9SAdrian Hunter						self.Init(pos, pos + 1, 0, 0)
e0c48bf9SAdrian Hunter					else:
e0c48bf9SAdrian Hunter						self.Init(error = f"-{short_name} option missing value")
e0c48bf9SAdrian Hunter				else:
e0c48bf9SAdrian Hunter					self.Init(pos, pos, 0, 2)
e0c48bf9SAdrian Hunter				return
e0c48bf9SAdrian Hunter			if opt[:n] == f"--{long_name}":
e0c48bf9SAdrian Hunter				if len(opt) == n:
e0c48bf9SAdrian Hunter					if pos + 1 < len(args):
e0c48bf9SAdrian Hunter						self.Init(pos, pos + 1, 0, 0)
e0c48bf9SAdrian Hunter					else:
e0c48bf9SAdrian Hunter						self.Init(error = f"--{long_name} option missing value")
e0c48bf9SAdrian Hunter				elif opt[n] == "=":
e0c48bf9SAdrian Hunter					self.Init(pos, pos, 0, n + 1)
e0c48bf9SAdrian Hunter				else:
e0c48bf9SAdrian Hunter					self.Init(error = f"--{long_name} option expected '='")
e0c48bf9SAdrian Hunter				return
e0c48bf9SAdrian Hunter			if m and opt[:1] == "-" and opt[:2] != "--" and short_name in opt:
e0c48bf9SAdrian Hunter				ipos = opt.index(short_name)
e0c48bf9SAdrian Hunter				if "-" in opt[1:]:
e0c48bf9SAdrian Hunter					hpos = opt[1:].index("-")
e0c48bf9SAdrian Hunter					if hpos < ipos:
e0c48bf9SAdrian Hunter						continue
e0c48bf9SAdrian Hunter				if ipos + 1 == len(opt):
e0c48bf9SAdrian Hunter					if pos + 1 < len(args):
e0c48bf9SAdrian Hunter						self.Init(pos, pos + 1, ipos, 0)
e0c48bf9SAdrian Hunter					else:
e0c48bf9SAdrian Hunter						self.Init(error = f"-{short_name} option missing value")
e0c48bf9SAdrian Hunter				else:
e0c48bf9SAdrian Hunter					self.Init(pos, pos, ipos, ipos + 1)
e0c48bf9SAdrian Hunter				return
e0c48bf9SAdrian Hunter		self.Init()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Value(self):
e0c48bf9SAdrian Hunter		if self.opt_element >= 0:
e0c48bf9SAdrian Hunter			if self.opt_element != self.value_element:
e0c48bf9SAdrian Hunter				return self.args[self.value_element]
e0c48bf9SAdrian Hunter			else:
e0c48bf9SAdrian Hunter				return self.args[self.value_element][self.value_pos:]
e0c48bf9SAdrian Hunter		return self.default
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Remove(self, args):
e0c48bf9SAdrian Hunter		if self.opt_element == -1:
e0c48bf9SAdrian Hunter			return
e0c48bf9SAdrian Hunter		if self.opt_element != self.value_element:
e0c48bf9SAdrian Hunter			del args[self.value_element]
e0c48bf9SAdrian Hunter		if self.opt_pos:
e0c48bf9SAdrian Hunter			args[self.opt_element] = args[self.opt_element][:self.opt_pos]
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			del args[self.opt_element]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef DetermineInputFileName(cmd):
e0c48bf9SAdrian Hunter	p = OptPos(cmd, "i", "input", "perf.data")
e0c48bf9SAdrian Hunter	if p.error:
e0c48bf9SAdrian Hunter		raise Exception(f"perf command {p.error}")
e0c48bf9SAdrian Hunter	file_name = p.Value()
e0c48bf9SAdrian Hunter	if not os.path.exists(file_name):
e0c48bf9SAdrian Hunter		raise Exception(f"perf command input file '{file_name}' not found")
e0c48bf9SAdrian Hunter	return file_name
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ReadOption(args, short_name, long_name, err_prefix, remove=False):
e0c48bf9SAdrian Hunter	p = OptPos(args, short_name, long_name)
e0c48bf9SAdrian Hunter	if p.error:
e0c48bf9SAdrian Hunter		raise Exception(f"{err_prefix}{p.error}")
e0c48bf9SAdrian Hunter	value = p.Value()
e0c48bf9SAdrian Hunter	if remove:
e0c48bf9SAdrian Hunter		p.Remove(args)
e0c48bf9SAdrian Hunter	return value
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ExtractOption(args, short_name, long_name, err_prefix):
e0c48bf9SAdrian Hunter	return ReadOption(args, short_name, long_name, err_prefix, True)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ReadPerfOption(args, short_name, long_name):
e0c48bf9SAdrian Hunter	return ReadOption(args, short_name, long_name, "perf command ")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ExtractPerfOption(args, short_name, long_name):
e0c48bf9SAdrian Hunter	return ExtractOption(args, short_name, long_name, "perf command ")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef PerfDoubleQuickCommands(cmd, file_name):
e0c48bf9SAdrian Hunter	cpu_str = ReadPerfOption(cmd, "C", "cpu")
e0c48bf9SAdrian Hunter	time_str = ReadPerfOption(cmd, "", "time")
e0c48bf9SAdrian Hunter	# Use double-quick sampling to determine trace data density
e0c48bf9SAdrian Hunter	times_cmd = ["perf", "script", "--ns", "--input", file_name, "--itrace=qqi"]
e0c48bf9SAdrian Hunter	if cpu_str != None and cpu_str != "":
e0c48bf9SAdrian Hunter		times_cmd.append(f"--cpu={cpu_str}")
e0c48bf9SAdrian Hunter	if time_str != None and time_str != "":
e0c48bf9SAdrian Hunter		times_cmd.append(f"--time={time_str}")
e0c48bf9SAdrian Hunter	cnts_cmd = list(times_cmd)
e0c48bf9SAdrian Hunter	cnts_cmd.append("-Fcpu")
e0c48bf9SAdrian Hunter	times_cmd.append("-Fcpu,time")
e0c48bf9SAdrian Hunter	return cnts_cmd, times_cmd
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterclass CPUTimeRange():
e0c48bf9SAdrian Hunter	def __init__(self, cpu):
e0c48bf9SAdrian Hunter		self.cpu = cpu
e0c48bf9SAdrian Hunter		self.sample_cnt = 0
e0c48bf9SAdrian Hunter		self.time_ranges = None
e0c48bf9SAdrian Hunter		self.interval = 0
e0c48bf9SAdrian Hunter		self.interval_remaining = 0
e0c48bf9SAdrian Hunter		self.remaining = 0
e0c48bf9SAdrian Hunter		self.tr_pos = 0
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef CalcTimeRangesByCPU(line, cpu, cpu_time_ranges, max_time):
e0c48bf9SAdrian Hunter	cpu_time_range = cpu_time_ranges[cpu]
e0c48bf9SAdrian Hunter	cpu_time_range.remaining -= 1
e0c48bf9SAdrian Hunter	cpu_time_range.interval_remaining -= 1
e0c48bf9SAdrian Hunter	if cpu_time_range.remaining == 0:
e0c48bf9SAdrian Hunter		cpu_time_range.time_ranges[cpu_time_range.tr_pos][1] = max_time
e0c48bf9SAdrian Hunter		return
e0c48bf9SAdrian Hunter	if cpu_time_range.interval_remaining == 0:
e0c48bf9SAdrian Hunter		time = TimeVal(line[1][:-1], 0)
e0c48bf9SAdrian Hunter		time_ranges = cpu_time_range.time_ranges
e0c48bf9SAdrian Hunter		time_ranges[cpu_time_range.tr_pos][1] = time - 1
e0c48bf9SAdrian Hunter		time_ranges.append([time, max_time])
e0c48bf9SAdrian Hunter		cpu_time_range.tr_pos += 1
e0c48bf9SAdrian Hunter		cpu_time_range.interval_remaining = cpu_time_range.interval
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef CountSamplesByCPU(line, cpu, cpu_time_ranges):
e0c48bf9SAdrian Hunter	try:
e0c48bf9SAdrian Hunter		cpu_time_ranges[cpu].sample_cnt += 1
e0c48bf9SAdrian Hunter	except:
e0c48bf9SAdrian Hunter		print("exception")
e0c48bf9SAdrian Hunter		print("cpu", cpu)
e0c48bf9SAdrian Hunter		print("len(cpu_time_ranges)", len(cpu_time_ranges))
e0c48bf9SAdrian Hunter		raise
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ProcessCommandOutputLines(cmd, per_cpu, fn, *x):
e0c48bf9SAdrian Hunter	# Assume CPU number is at beginning of line and enclosed by []
e0c48bf9SAdrian Hunter	pat = re.compile(r"\s*\[[0-9]+\]")
e0c48bf9SAdrian Hunter	p = subprocess.Popen(cmd, stdout=subprocess.PIPE)
e0c48bf9SAdrian Hunter	while True:
*7d49ced8SAthira Rajeev		line = p.stdout.readline()
*7d49ced8SAthira Rajeev		if line:
e0c48bf9SAdrian Hunter			line = line.decode("utf-8")
e0c48bf9SAdrian Hunter			if pat.match(line):
e0c48bf9SAdrian Hunter				line = line.split()
e0c48bf9SAdrian Hunter				if per_cpu:
e0c48bf9SAdrian Hunter					# Assumes CPU number is enclosed by []
e0c48bf9SAdrian Hunter					cpu = int(line[0][1:-1])
e0c48bf9SAdrian Hunter				else:
e0c48bf9SAdrian Hunter					cpu = 0
e0c48bf9SAdrian Hunter				fn(line, cpu, *x)
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			break
e0c48bf9SAdrian Hunter	p.wait()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef IntersectTimeRanges(new_time_ranges, time_ranges):
e0c48bf9SAdrian Hunter	pos = 0
e0c48bf9SAdrian Hunter	new_pos = 0
e0c48bf9SAdrian Hunter	# Can assume len(time_ranges) != 0 and len(new_time_ranges) != 0
e0c48bf9SAdrian Hunter	# Note also, there *must* be at least one intersection.
e0c48bf9SAdrian Hunter	while pos < len(time_ranges) and new_pos < len(new_time_ranges):
e0c48bf9SAdrian Hunter		# new end < old start => no intersection, remove new
e0c48bf9SAdrian Hunter		if new_time_ranges[new_pos][1] < time_ranges[pos][0]:
e0c48bf9SAdrian Hunter			del new_time_ranges[new_pos]
e0c48bf9SAdrian Hunter			continue
e0c48bf9SAdrian Hunter		# new start > old end => no intersection, check next
e0c48bf9SAdrian Hunter		if new_time_ranges[new_pos][0] > time_ranges[pos][1]:
e0c48bf9SAdrian Hunter			pos += 1
e0c48bf9SAdrian Hunter			if pos < len(time_ranges):
e0c48bf9SAdrian Hunter				continue
e0c48bf9SAdrian Hunter			# no next, so remove remaining
e0c48bf9SAdrian Hunter			while new_pos < len(new_time_ranges):
e0c48bf9SAdrian Hunter				del new_time_ranges[new_pos]
e0c48bf9SAdrian Hunter			return
e0c48bf9SAdrian Hunter		# Found an intersection
e0c48bf9SAdrian Hunter		# new start < old start => adjust new start = old start
e0c48bf9SAdrian Hunter		if new_time_ranges[new_pos][0] < time_ranges[pos][0]:
e0c48bf9SAdrian Hunter			new_time_ranges[new_pos][0] = time_ranges[pos][0]
e0c48bf9SAdrian Hunter		# new end > old end => keep the overlap, insert the remainder
e0c48bf9SAdrian Hunter		if new_time_ranges[new_pos][1] > time_ranges[pos][1]:
e0c48bf9SAdrian Hunter			r = [ time_ranges[pos][1] + 1, new_time_ranges[new_pos][1] ]
e0c48bf9SAdrian Hunter			new_time_ranges[new_pos][1] = time_ranges[pos][1]
e0c48bf9SAdrian Hunter			new_pos += 1
e0c48bf9SAdrian Hunter			new_time_ranges.insert(new_pos, r)
e0c48bf9SAdrian Hunter			continue
e0c48bf9SAdrian Hunter		# new [start, end] is within old [start, end]
e0c48bf9SAdrian Hunter		new_pos += 1
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef SplitTimeRangesByTraceDataDensity(time_ranges, cpus, nr, cmd, file_name, per_cpu, min_size, min_interval, verbosity):
e0c48bf9SAdrian Hunter	if verbosity.normal:
e0c48bf9SAdrian Hunter		print("\rAnalyzing...", flush=True, end=" ")
e0c48bf9SAdrian Hunter		if verbosity.verbose:
e0c48bf9SAdrian Hunter			print()
e0c48bf9SAdrian Hunter	cnts_cmd, times_cmd = PerfDoubleQuickCommands(cmd, file_name)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	nr_cpus = cpus[-1] + 1 if per_cpu else 1
e0c48bf9SAdrian Hunter	if per_cpu:
e0c48bf9SAdrian Hunter		nr_cpus = cpus[-1] + 1
e0c48bf9SAdrian Hunter		cpu_time_ranges = [ CPUTimeRange(cpu) for cpu in range(nr_cpus) ]
e0c48bf9SAdrian Hunter	else:
e0c48bf9SAdrian Hunter		nr_cpus = 1
e0c48bf9SAdrian Hunter		cpu_time_ranges = [ CPUTimeRange(-1) ]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	if verbosity.debug:
e0c48bf9SAdrian Hunter		print("nr_cpus", nr_cpus)
e0c48bf9SAdrian Hunter		print("cnts_cmd", cnts_cmd)
e0c48bf9SAdrian Hunter		print("times_cmd", times_cmd)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	# Count the number of "double quick" samples per CPU
e0c48bf9SAdrian Hunter	ProcessCommandOutputLines(cnts_cmd, per_cpu, CountSamplesByCPU, cpu_time_ranges)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	tot = 0
e0c48bf9SAdrian Hunter	mx = 0
e0c48bf9SAdrian Hunter	for cpu_time_range in cpu_time_ranges:
e0c48bf9SAdrian Hunter		cnt = cpu_time_range.sample_cnt
e0c48bf9SAdrian Hunter		tot += cnt
e0c48bf9SAdrian Hunter		if cnt > mx:
e0c48bf9SAdrian Hunter			mx = cnt
e0c48bf9SAdrian Hunter		if verbosity.debug:
e0c48bf9SAdrian Hunter			print("cpu:", cpu_time_range.cpu, "sample_cnt", cnt)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	if min_size < 1:
e0c48bf9SAdrian Hunter		min_size = 1
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	if mx < min_size:
e0c48bf9SAdrian Hunter		# Too little data to be worth splitting
e0c48bf9SAdrian Hunter		if verbosity.debug:
e0c48bf9SAdrian Hunter			print("Too little data to split by time")
e0c48bf9SAdrian Hunter		if nr == 0:
e0c48bf9SAdrian Hunter			nr = 1
e0c48bf9SAdrian Hunter		return [ SplitTimeRangesIntoN(time_ranges, nr, min_interval) ]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	if nr:
e0c48bf9SAdrian Hunter		divisor = nr
e0c48bf9SAdrian Hunter		min_size = 1
e0c48bf9SAdrian Hunter	else:
e0c48bf9SAdrian Hunter		divisor = NumberOfCPUs()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	interval = int(round(tot / divisor, 0))
e0c48bf9SAdrian Hunter	if interval < min_size:
e0c48bf9SAdrian Hunter		interval = min_size
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	if verbosity.debug:
e0c48bf9SAdrian Hunter		print("divisor", divisor)
e0c48bf9SAdrian Hunter		print("min_size", min_size)
e0c48bf9SAdrian Hunter		print("interval", interval)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	min_time = time_ranges[0][0]
e0c48bf9SAdrian Hunter	max_time = time_ranges[-1][1]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	for cpu_time_range in cpu_time_ranges:
e0c48bf9SAdrian Hunter		cnt = cpu_time_range.sample_cnt
e0c48bf9SAdrian Hunter		if cnt == 0:
e0c48bf9SAdrian Hunter			cpu_time_range.time_ranges = copy.deepcopy(time_ranges)
e0c48bf9SAdrian Hunter			continue
e0c48bf9SAdrian Hunter		# Adjust target interval for CPU to give approximately equal interval sizes
e0c48bf9SAdrian Hunter		# Determine number of intervals, rounding to nearest integer
e0c48bf9SAdrian Hunter		n = int(round(cnt / interval, 0))
e0c48bf9SAdrian Hunter		if n < 1:
e0c48bf9SAdrian Hunter			n = 1
e0c48bf9SAdrian Hunter		# Determine interval size, rounding up
e0c48bf9SAdrian Hunter		d, m = divmod(cnt, n)
e0c48bf9SAdrian Hunter		if m:
e0c48bf9SAdrian Hunter			d += 1
e0c48bf9SAdrian Hunter		cpu_time_range.interval = d
e0c48bf9SAdrian Hunter		cpu_time_range.interval_remaining = d
e0c48bf9SAdrian Hunter		cpu_time_range.remaining = cnt
e0c48bf9SAdrian Hunter		# Init. time ranges for each CPU with the start time
e0c48bf9SAdrian Hunter		cpu_time_range.time_ranges = [ [min_time, max_time] ]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	# Set time ranges so that the same number of "double quick" samples
e0c48bf9SAdrian Hunter	# will fall into each time range.
e0c48bf9SAdrian Hunter	ProcessCommandOutputLines(times_cmd, per_cpu, CalcTimeRangesByCPU, cpu_time_ranges, max_time)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	for cpu_time_range in cpu_time_ranges:
e0c48bf9SAdrian Hunter		if cpu_time_range.sample_cnt:
e0c48bf9SAdrian Hunter			IntersectTimeRanges(cpu_time_range.time_ranges, time_ranges)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	return [cpu_time_ranges[cpu].time_ranges for cpu in cpus]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef SplitSingleTimeRangeIntoN(time_range, n):
e0c48bf9SAdrian Hunter	if n <= 1:
e0c48bf9SAdrian Hunter		return [time_range]
e0c48bf9SAdrian Hunter	start = time_range[0]
e0c48bf9SAdrian Hunter	end   = time_range[1]
e0c48bf9SAdrian Hunter	duration = int((end - start + 1) / n)
e0c48bf9SAdrian Hunter	if duration < 1:
e0c48bf9SAdrian Hunter		return [time_range]
e0c48bf9SAdrian Hunter	time_ranges = []
e0c48bf9SAdrian Hunter	for i in range(n):
e0c48bf9SAdrian Hunter		time_ranges.append([start, start + duration - 1])
e0c48bf9SAdrian Hunter		start += duration
e0c48bf9SAdrian Hunter	time_ranges[-1][1] = end
e0c48bf9SAdrian Hunter	return time_ranges
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef TimeRangeDuration(r):
e0c48bf9SAdrian Hunter	return r[1] - r[0] + 1
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef TotalDuration(time_ranges):
e0c48bf9SAdrian Hunter	duration = 0
e0c48bf9SAdrian Hunter	for r in time_ranges:
e0c48bf9SAdrian Hunter		duration += TimeRangeDuration(r)
e0c48bf9SAdrian Hunter	return duration
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef SplitTimeRangesByInterval(time_ranges, interval):
e0c48bf9SAdrian Hunter	new_ranges = []
e0c48bf9SAdrian Hunter	for r in time_ranges:
e0c48bf9SAdrian Hunter		duration = TimeRangeDuration(r)
e0c48bf9SAdrian Hunter		n = duration / interval
e0c48bf9SAdrian Hunter		n = int(round(n, 0))
e0c48bf9SAdrian Hunter		new_ranges += SplitSingleTimeRangeIntoN(r, n)
e0c48bf9SAdrian Hunter	return new_ranges
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef SplitTimeRangesIntoN(time_ranges, n, min_interval):
e0c48bf9SAdrian Hunter	if n <= len(time_ranges):
e0c48bf9SAdrian Hunter		return time_ranges
e0c48bf9SAdrian Hunter	duration = TotalDuration(time_ranges)
e0c48bf9SAdrian Hunter	interval = duration / n
e0c48bf9SAdrian Hunter	if interval < min_interval:
e0c48bf9SAdrian Hunter		interval = min_interval
e0c48bf9SAdrian Hunter	return SplitTimeRangesByInterval(time_ranges, interval)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef RecombineTimeRanges(tr):
e0c48bf9SAdrian Hunter	new_tr = copy.deepcopy(tr)
e0c48bf9SAdrian Hunter	n = len(new_tr)
e0c48bf9SAdrian Hunter	i = 1
e0c48bf9SAdrian Hunter	while i < len(new_tr):
e0c48bf9SAdrian Hunter		# if prev end + 1 == cur start, combine them
e0c48bf9SAdrian Hunter		if new_tr[i - 1][1] + 1 == new_tr[i][0]:
e0c48bf9SAdrian Hunter			new_tr[i][0] = new_tr[i - 1][0]
e0c48bf9SAdrian Hunter			del new_tr[i - 1]
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			i += 1
e0c48bf9SAdrian Hunter	return new_tr
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef OpenTimeRangeEnds(time_ranges, min_time, max_time):
e0c48bf9SAdrian Hunter	if time_ranges[0][0] <= min_time:
e0c48bf9SAdrian Hunter		time_ranges[0][0] = None
e0c48bf9SAdrian Hunter	if time_ranges[-1][1] >= max_time:
e0c48bf9SAdrian Hunter		time_ranges[-1][1] = None
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef BadTimeStr(time_str):
e0c48bf9SAdrian Hunter	raise Exception(f"perf command bad time option: '{time_str}'\nCheck also 'time of first sample' and 'time of last sample' in perf script --header-only")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ValidateTimeRanges(time_ranges, time_str):
e0c48bf9SAdrian Hunter	n = len(time_ranges)
e0c48bf9SAdrian Hunter	for i in range(n):
e0c48bf9SAdrian Hunter		start = time_ranges[i][0]
e0c48bf9SAdrian Hunter		end   = time_ranges[i][1]
e0c48bf9SAdrian Hunter		if i != 0 and start <= time_ranges[i - 1][1]:
e0c48bf9SAdrian Hunter			BadTimeStr(time_str)
e0c48bf9SAdrian Hunter		if start > end:
e0c48bf9SAdrian Hunter			BadTimeStr(time_str)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef TimeVal(s, dflt):
e0c48bf9SAdrian Hunter	s = s.strip()
e0c48bf9SAdrian Hunter	if s == "":
e0c48bf9SAdrian Hunter		return dflt
e0c48bf9SAdrian Hunter	a = s.split(".")
e0c48bf9SAdrian Hunter	if len(a) > 2:
e0c48bf9SAdrian Hunter		raise Exception(f"Bad time value'{s}'")
e0c48bf9SAdrian Hunter	x = int(a[0])
e0c48bf9SAdrian Hunter	if x < 0:
e0c48bf9SAdrian Hunter		raise Exception("Negative time not allowed")
e0c48bf9SAdrian Hunter	x *= 1000000000
e0c48bf9SAdrian Hunter	if len(a) > 1:
e0c48bf9SAdrian Hunter		x += int((a[1] + "000000000")[:9])
e0c48bf9SAdrian Hunter	return x
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef BadCPUStr(cpu_str):
e0c48bf9SAdrian Hunter	raise Exception(f"perf command bad cpu option: '{cpu_str}'\nCheck also 'nrcpus avail' in perf script --header-only")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ParseTimeStr(time_str, min_time, max_time):
e0c48bf9SAdrian Hunter	if time_str == None or time_str == "":
e0c48bf9SAdrian Hunter		return [[min_time, max_time]]
e0c48bf9SAdrian Hunter	time_ranges = []
e0c48bf9SAdrian Hunter	for r in time_str.split():
e0c48bf9SAdrian Hunter		a = r.split(",")
e0c48bf9SAdrian Hunter		if len(a) != 2:
e0c48bf9SAdrian Hunter			BadTimeStr(time_str)
e0c48bf9SAdrian Hunter		try:
e0c48bf9SAdrian Hunter			start = TimeVal(a[0], min_time)
e0c48bf9SAdrian Hunter			end   = TimeVal(a[1], max_time)
e0c48bf9SAdrian Hunter		except:
e0c48bf9SAdrian Hunter			BadTimeStr(time_str)
e0c48bf9SAdrian Hunter		time_ranges.append([start, end])
e0c48bf9SAdrian Hunter	ValidateTimeRanges(time_ranges, time_str)
e0c48bf9SAdrian Hunter	return time_ranges
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef ParseCPUStr(cpu_str, nr_cpus):
e0c48bf9SAdrian Hunter	if cpu_str == None or cpu_str == "":
e0c48bf9SAdrian Hunter		return [-1]
e0c48bf9SAdrian Hunter	cpus = []
e0c48bf9SAdrian Hunter	for r in cpu_str.split(","):
e0c48bf9SAdrian Hunter		a = r.split("-")
e0c48bf9SAdrian Hunter		if len(a) < 1 or len(a) > 2:
e0c48bf9SAdrian Hunter			BadCPUStr(cpu_str)
e0c48bf9SAdrian Hunter		try:
e0c48bf9SAdrian Hunter			start = int(a[0].strip())
e0c48bf9SAdrian Hunter			if len(a) > 1:
e0c48bf9SAdrian Hunter				end = int(a[1].strip())
e0c48bf9SAdrian Hunter			else:
e0c48bf9SAdrian Hunter				end = start
e0c48bf9SAdrian Hunter		except:
e0c48bf9SAdrian Hunter			BadCPUStr(cpu_str)
e0c48bf9SAdrian Hunter		if start < 0 or end < 0 or end < start or end >= nr_cpus:
e0c48bf9SAdrian Hunter			BadCPUStr(cpu_str)
e0c48bf9SAdrian Hunter		cpus.extend(range(start, end + 1))
e0c48bf9SAdrian Hunter	cpus = list(set(cpus)) # Remove duplicates
e0c48bf9SAdrian Hunter	cpus.sort()
e0c48bf9SAdrian Hunter	return cpus
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterclass ParallelPerf():
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def __init__(self, a):
e0c48bf9SAdrian Hunter		for arg_name in vars(a):
e0c48bf9SAdrian Hunter			setattr(self, arg_name, getattr(a, arg_name))
e0c48bf9SAdrian Hunter		self.orig_nr = self.nr
e0c48bf9SAdrian Hunter		self.orig_cmd = list(self.cmd)
e0c48bf9SAdrian Hunter		self.perf = self.cmd[0]
e0c48bf9SAdrian Hunter		if os.path.exists(self.output_dir):
e0c48bf9SAdrian Hunter			raise Exception(f"Output '{self.output_dir}' already exists")
e0c48bf9SAdrian Hunter		if self.jobs < 0 or self.nr < 0 or self.interval < 0:
e0c48bf9SAdrian Hunter			raise Exception("Bad options (negative values): try -h option for help")
e0c48bf9SAdrian Hunter		if self.nr != 0 and self.interval != 0:
e0c48bf9SAdrian Hunter			raise Exception("Cannot specify number of time subdivisions and time interval")
e0c48bf9SAdrian Hunter		if self.jobs == 0:
e0c48bf9SAdrian Hunter			self.jobs = NumberOfCPUs()
e0c48bf9SAdrian Hunter		if self.nr == 0 and self.interval == 0:
e0c48bf9SAdrian Hunter			if self.per_cpu:
e0c48bf9SAdrian Hunter				self.nr = 1
e0c48bf9SAdrian Hunter			else:
e0c48bf9SAdrian Hunter				self.nr = self.jobs
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Init(self):
e0c48bf9SAdrian Hunter		if self.verbosity.debug:
e0c48bf9SAdrian Hunter			print("cmd", self.cmd)
e0c48bf9SAdrian Hunter		self.file_name = DetermineInputFileName(self.cmd)
e0c48bf9SAdrian Hunter		self.hdr = ReadHeader(self.perf, self.file_name)
e0c48bf9SAdrian Hunter		self.hdr_dict = ParseHeader(self.hdr)
e0c48bf9SAdrian Hunter		self.cmd_line = HeaderField(self.hdr_dict, "cmdline")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def ExtractTimeInfo(self):
e0c48bf9SAdrian Hunter		self.min_time = TimeVal(HeaderField(self.hdr_dict, "time of first sample"), 0)
e0c48bf9SAdrian Hunter		self.max_time = TimeVal(HeaderField(self.hdr_dict, "time of last sample"), 0)
e0c48bf9SAdrian Hunter		self.time_str = ExtractPerfOption(self.cmd, "", "time")
e0c48bf9SAdrian Hunter		self.time_ranges = ParseTimeStr(self.time_str, self.min_time, self.max_time)
e0c48bf9SAdrian Hunter		if self.verbosity.debug:
e0c48bf9SAdrian Hunter			print("time_ranges", self.time_ranges)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def ExtractCPUInfo(self):
e0c48bf9SAdrian Hunter		if self.per_cpu:
e0c48bf9SAdrian Hunter			nr_cpus = int(HeaderField(self.hdr_dict, "nrcpus avail"))
e0c48bf9SAdrian Hunter			self.cpu_str = ExtractPerfOption(self.cmd, "C", "cpu")
e0c48bf9SAdrian Hunter			if self.cpu_str == None or self.cpu_str == "":
e0c48bf9SAdrian Hunter				self.cpus = [ x for x in range(nr_cpus) ]
e0c48bf9SAdrian Hunter			else:
e0c48bf9SAdrian Hunter				self.cpus = ParseCPUStr(self.cpu_str, nr_cpus)
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			self.cpu_str = None
e0c48bf9SAdrian Hunter			self.cpus = [-1]
e0c48bf9SAdrian Hunter		if self.verbosity.debug:
e0c48bf9SAdrian Hunter			print("cpus", self.cpus)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def IsIntelPT(self):
e0c48bf9SAdrian Hunter		return self.cmd_line.find("intel_pt") >= 0
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def SplitTimeRanges(self):
e0c48bf9SAdrian Hunter		if self.IsIntelPT() and self.interval == 0:
e0c48bf9SAdrian Hunter			self.split_time_ranges_for_each_cpu = \
e0c48bf9SAdrian Hunter				SplitTimeRangesByTraceDataDensity(self.time_ranges, self.cpus, self.orig_nr,
e0c48bf9SAdrian Hunter								  self.orig_cmd, self.file_name, self.per_cpu,
e0c48bf9SAdrian Hunter								  self.min_size, self.min_interval, self.verbosity)
e0c48bf9SAdrian Hunter		elif self.nr:
e0c48bf9SAdrian Hunter			self.split_time_ranges_for_each_cpu = [ SplitTimeRangesIntoN(self.time_ranges, self.nr, self.min_interval) ]
e0c48bf9SAdrian Hunter		else:
e0c48bf9SAdrian Hunter			self.split_time_ranges_for_each_cpu = [ SplitTimeRangesByInterval(self.time_ranges, self.interval) ]
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def CheckTimeRanges(self):
e0c48bf9SAdrian Hunter		for tr in self.split_time_ranges_for_each_cpu:
e0c48bf9SAdrian Hunter			# Re-combined time ranges should be the same
e0c48bf9SAdrian Hunter			new_tr = RecombineTimeRanges(tr)
e0c48bf9SAdrian Hunter			if new_tr != self.time_ranges:
e0c48bf9SAdrian Hunter				if self.verbosity.debug:
e0c48bf9SAdrian Hunter					print("tr", tr)
e0c48bf9SAdrian Hunter					print("new_tr", new_tr)
e0c48bf9SAdrian Hunter				raise Exception("Self test failed!")
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def OpenTimeRangeEnds(self):
e0c48bf9SAdrian Hunter		for time_ranges in self.split_time_ranges_for_each_cpu:
e0c48bf9SAdrian Hunter			OpenTimeRangeEnds(time_ranges, self.min_time, self.max_time)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def CreateWorkList(self):
e0c48bf9SAdrian Hunter		self.worklist = CreateWorkList(self.cmd, self.pipe_to, self.output_dir, self.cpus, self.split_time_ranges_for_each_cpu)
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def PerfDataRecordedPerCPU(self):
e0c48bf9SAdrian Hunter		if "--per-thread" in self.cmd_line.split():
e0c48bf9SAdrian Hunter			return False
e0c48bf9SAdrian Hunter		return True
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def DefaultToPerCPU(self):
e0c48bf9SAdrian Hunter		# --no-per-cpu option takes precedence
e0c48bf9SAdrian Hunter		if self.no_per_cpu:
e0c48bf9SAdrian Hunter			return False
e0c48bf9SAdrian Hunter		if not self.PerfDataRecordedPerCPU():
e0c48bf9SAdrian Hunter			return False
e0c48bf9SAdrian Hunter		# Default to per-cpu for Intel PT data that was recorded per-cpu,
e0c48bf9SAdrian Hunter		# because decoding can be done for each CPU separately.
e0c48bf9SAdrian Hunter		if self.IsIntelPT():
e0c48bf9SAdrian Hunter			return True
e0c48bf9SAdrian Hunter		return False
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Config(self):
e0c48bf9SAdrian Hunter		self.Init()
e0c48bf9SAdrian Hunter		self.ExtractTimeInfo()
e0c48bf9SAdrian Hunter		if not self.per_cpu:
e0c48bf9SAdrian Hunter			self.per_cpu = self.DefaultToPerCPU()
e0c48bf9SAdrian Hunter		if self.verbosity.debug:
e0c48bf9SAdrian Hunter			print("per_cpu", self.per_cpu)
e0c48bf9SAdrian Hunter		self.ExtractCPUInfo()
e0c48bf9SAdrian Hunter		self.SplitTimeRanges()
e0c48bf9SAdrian Hunter		if self.verbosity.self_test:
e0c48bf9SAdrian Hunter			self.CheckTimeRanges()
e0c48bf9SAdrian Hunter		# Prefer open-ended time range to starting / ending with min_time / max_time resp.
e0c48bf9SAdrian Hunter		self.OpenTimeRangeEnds()
e0c48bf9SAdrian Hunter		self.CreateWorkList()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	def Run(self):
e0c48bf9SAdrian Hunter		if self.dry_run:
e0c48bf9SAdrian Hunter			print(len(self.worklist),"jobs:")
e0c48bf9SAdrian Hunter			for w in self.worklist:
e0c48bf9SAdrian Hunter				print(w.Command())
e0c48bf9SAdrian Hunter			return True
e0c48bf9SAdrian Hunter		result = RunWork(self.worklist, self.jobs, verbosity=self.verbosity)
e0c48bf9SAdrian Hunter		if self.verbosity.verbose:
e0c48bf9SAdrian Hunter			print(glb_prog_name, "done")
e0c48bf9SAdrian Hunter		return result
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef RunParallelPerf(a):
e0c48bf9SAdrian Hunter	pp = ParallelPerf(a)
e0c48bf9SAdrian Hunter	pp.Config()
e0c48bf9SAdrian Hunter	return pp.Run()
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterdef Main(args):
e0c48bf9SAdrian Hunter	ap = argparse.ArgumentParser(
e0c48bf9SAdrian Hunter		prog=glb_prog_name, formatter_class = argparse.RawDescriptionHelpFormatter,
e0c48bf9SAdrian Hunter		description =
e0c48bf9SAdrian Hunter"""
e0c48bf9SAdrian HunterRun a perf script command multiple times in parallel, using perf script options
e0c48bf9SAdrian Hunter--cpu and --time so that each job processes a different chunk of the data.
e0c48bf9SAdrian Hunter""",
e0c48bf9SAdrian Hunter		epilog =
e0c48bf9SAdrian Hunter"""
e0c48bf9SAdrian HunterFollow the options by '--' and then the perf script command e.g.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	$ perf record -a -- sleep 10
e0c48bf9SAdrian Hunter	$ parallel-perf.py --nr=4 -- perf script --ns
e0c48bf9SAdrian Hunter	All jobs finished successfully
e0c48bf9SAdrian Hunter	$ tree parallel-perf-output/
e0c48bf9SAdrian Hunter	parallel-perf-output/
e0c48bf9SAdrian Hunter	├── time-range-0
e0c48bf9SAdrian Hunter	│   ├── cmd.txt
e0c48bf9SAdrian Hunter	│   └── out.txt
e0c48bf9SAdrian Hunter	├── time-range-1
e0c48bf9SAdrian Hunter	│   ├── cmd.txt
e0c48bf9SAdrian Hunter	│   └── out.txt
e0c48bf9SAdrian Hunter	├── time-range-2
e0c48bf9SAdrian Hunter	│   ├── cmd.txt
e0c48bf9SAdrian Hunter	│   └── out.txt
e0c48bf9SAdrian Hunter	└── time-range-3
e0c48bf9SAdrian Hunter	    ├── cmd.txt
e0c48bf9SAdrian Hunter	    └── out.txt
e0c48bf9SAdrian Hunter	$ find parallel-perf-output -name cmd.txt | sort | xargs grep -H .
e0c48bf9SAdrian Hunter	parallel-perf-output/time-range-0/cmd.txt:perf script --time=,9466.504461499 --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/time-range-1/cmd.txt:perf script --time=9466.504461500,9469.005396999 --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/time-range-2/cmd.txt:perf script --time=9469.005397000,9471.506332499 --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/time-range-3/cmd.txt:perf script --time=9471.506332500, --ns
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterAny perf script command can be used, including the use of perf script options
e0c48bf9SAdrian Hunter--dlfilter and --script, so that the benefit of running parallel jobs
e0c48bf9SAdrian Hunternaturally extends to them also.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterIf option --pipe-to is used, standard output is first piped through that
e0c48bf9SAdrian Huntercommand. Beware, if the command fails (e.g. grep with no matches), it will be
e0c48bf9SAdrian Hunterconsidered a fatal error.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterFinal standard output is redirected to files named out.txt in separate
e0c48bf9SAdrian Huntersubdirectories under the output directory. Similarly, standard error is
e0c48bf9SAdrian Hunterwritten to files named err.txt. In addition, files named cmd.txt contain the
e0c48bf9SAdrian Huntercorresponding perf script command. After processing, err.txt files are removed
e0c48bf9SAdrian Hunterif they are empty.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterIf any job exits with a non-zero exit code, then all jobs are killed and no
e0c48bf9SAdrian Huntermore are started. A message is printed if any job results in a non-empty
e0c48bf9SAdrian Huntererr.txt file.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterThere is a separate output subdirectory for each time range. If the --per-cpu
e0c48bf9SAdrian Hunteroption is used, these are further grouped under cpu-n subdirectories, e.g.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunter	$ parallel-perf.py --per-cpu --nr=2 -- perf script --ns --cpu=0,1
e0c48bf9SAdrian Hunter	All jobs finished successfully
e0c48bf9SAdrian Hunter	$ tree parallel-perf-output
e0c48bf9SAdrian Hunter	parallel-perf-output/
e0c48bf9SAdrian Hunter	├── cpu-0
e0c48bf9SAdrian Hunter	│   ├── time-range-0
e0c48bf9SAdrian Hunter	│   │   ├── cmd.txt
e0c48bf9SAdrian Hunter	│   │   └── out.txt
e0c48bf9SAdrian Hunter	│   └── time-range-1
e0c48bf9SAdrian Hunter	│       ├── cmd.txt
e0c48bf9SAdrian Hunter	│       └── out.txt
e0c48bf9SAdrian Hunter	└── cpu-1
e0c48bf9SAdrian Hunter	    ├── time-range-0
e0c48bf9SAdrian Hunter	    │   ├── cmd.txt
e0c48bf9SAdrian Hunter	    │   └── out.txt
e0c48bf9SAdrian Hunter	    └── time-range-1
e0c48bf9SAdrian Hunter	        ├── cmd.txt
e0c48bf9SAdrian Hunter	        └── out.txt
e0c48bf9SAdrian Hunter	$ find parallel-perf-output -name cmd.txt | sort | xargs grep -H .
e0c48bf9SAdrian Hunter	parallel-perf-output/cpu-0/time-range-0/cmd.txt:perf script --cpu=0 --time=,9469.005396999 --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/cpu-0/time-range-1/cmd.txt:perf script --cpu=0 --time=9469.005397000, --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/cpu-1/time-range-0/cmd.txt:perf script --cpu=1 --time=,9469.005396999 --ns
e0c48bf9SAdrian Hunter	parallel-perf-output/cpu-1/time-range-1/cmd.txt:perf script --cpu=1 --time=9469.005397000, --ns
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterSubdivisions of time range, and cpus if the --per-cpu option is used, are
e0c48bf9SAdrian Hunterexpressed by the --time and --cpu perf script options respectively. If the
e0c48bf9SAdrian Huntersupplied perf script command has a --time option, then that time range is
e0c48bf9SAdrian Huntersubdivided, otherwise the time range given by 'time of first sample' to
e0c48bf9SAdrian Hunter'time of last sample' is used (refer perf script --header-only). Similarly, the
e0c48bf9SAdrian Huntersupplied perf script command may provide a --cpu option, and only those CPUs
e0c48bf9SAdrian Hunterwill be processed.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterTo prevent time intervals becoming too small, the --min-interval option can
e0c48bf9SAdrian Hunterbe used.
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian HunterNote there is special handling for processing Intel PT traces. If an interval is
e0c48bf9SAdrian Hunternot specified and the perf record command contained the intel_pt event, then the
e0c48bf9SAdrian Huntertime range will be subdivided in order to produce subdivisions that contain
e0c48bf9SAdrian Hunterapproximately the same amount of trace data. That is accomplished by counting
e0c48bf9SAdrian Hunterdouble-quick (--itrace=qqi) samples, and choosing time ranges that encompass
e0c48bf9SAdrian Hunterapproximately the same number of samples. In that case, time ranges may not be
e0c48bf9SAdrian Hunterthe same for each CPU processed. For Intel PT, --per-cpu is the default, but
e0c48bf9SAdrian Hunterthat can be overridden by --no-per-cpu. Note, for Intel PT, double-quick
e0c48bf9SAdrian Hunterdecoding produces 1 sample for each PSB synchronization packet, which in turn
e0c48bf9SAdrian Huntercome after a certain number of bytes output, determined by psb_period (refer
e0c48bf9SAdrian Hunterperf Intel PT documentation). The minimum number of double-quick samples that
e0c48bf9SAdrian Hunterwill define a time range can be set by the --min_size option, which defaults to
e0c48bf9SAdrian Hunter64.
e0c48bf9SAdrian Hunter""")
e0c48bf9SAdrian Hunter	ap.add_argument("-o", "--output-dir", default="parallel-perf-output", help="output directory (default 'parallel-perf-output')")
e0c48bf9SAdrian Hunter	ap.add_argument("-j", "--jobs", type=int, default=0, help="maximum number of jobs to run in parallel at one time (default is the number of CPUs)")
e0c48bf9SAdrian Hunter	ap.add_argument("-n", "--nr", type=int, default=0, help="number of time subdivisions (default is the number of jobs)")
e0c48bf9SAdrian Hunter	ap.add_argument("-i", "--interval", type=float, default=0, help="subdivide the time range using this time interval (in seconds e.g. 0.1 for a tenth of a second)")
e0c48bf9SAdrian Hunter	ap.add_argument("-c", "--per-cpu", action="store_true", help="process data for each CPU in parallel")
e0c48bf9SAdrian Hunter	ap.add_argument("-m", "--min-interval", type=float, default=glb_min_interval, help=f"minimum interval (default {glb_min_interval} seconds)")
e0c48bf9SAdrian Hunter	ap.add_argument("-p", "--pipe-to", help="command to pipe output to (optional)")
e0c48bf9SAdrian Hunter	ap.add_argument("-N", "--no-per-cpu", action="store_true", help="do not process data for each CPU in parallel")
e0c48bf9SAdrian Hunter	ap.add_argument("-b", "--min_size", type=int, default=glb_min_samples, help="minimum data size (for Intel PT in PSBs)")
e0c48bf9SAdrian Hunter	ap.add_argument("-D", "--dry-run", action="store_true", help="do not run any jobs, just show the perf script commands")
e0c48bf9SAdrian Hunter	ap.add_argument("-q", "--quiet", action="store_true", help="do not print any messages except errors")
e0c48bf9SAdrian Hunter	ap.add_argument("-v", "--verbose", action="store_true", help="print more messages")
e0c48bf9SAdrian Hunter	ap.add_argument("-d", "--debug", action="store_true", help="print debugging messages")
e0c48bf9SAdrian Hunter	cmd_line = list(args)
e0c48bf9SAdrian Hunter	try:
e0c48bf9SAdrian Hunter		split_pos = cmd_line.index("--")
e0c48bf9SAdrian Hunter		cmd = cmd_line[split_pos + 1:]
e0c48bf9SAdrian Hunter		args = cmd_line[:split_pos]
e0c48bf9SAdrian Hunter	except:
e0c48bf9SAdrian Hunter		cmd = None
e0c48bf9SAdrian Hunter		args = cmd_line
e0c48bf9SAdrian Hunter	a = ap.parse_args(args=args[1:])
e0c48bf9SAdrian Hunter	a.cmd = cmd
e0c48bf9SAdrian Hunter	a.verbosity = Verbosity(a.quiet, a.verbose, a.debug)
e0c48bf9SAdrian Hunter	try:
e0c48bf9SAdrian Hunter		if a.cmd == None:
e0c48bf9SAdrian Hunter			if len(args) <= 1:
e0c48bf9SAdrian Hunter				ap.print_help()
e0c48bf9SAdrian Hunter				return True
e0c48bf9SAdrian Hunter			raise Exception("Command line must contain '--' before perf command")
e0c48bf9SAdrian Hunter		return RunParallelPerf(a)
e0c48bf9SAdrian Hunter	except Exception as e:
e0c48bf9SAdrian Hunter		print("Fatal error: ", str(e))
e0c48bf9SAdrian Hunter		if a.debug:
e0c48bf9SAdrian Hunter			raise
e0c48bf9SAdrian Hunter		return False
e0c48bf9SAdrian Hunter
e0c48bf9SAdrian Hunterif __name__ == "__main__":
e0c48bf9SAdrian Hunter	if not Main(sys.argv):
e0c48bf9SAdrian Hunter		sys.exit(1)