ematvey/nvidia-docker-stats.py

## nvidia-docker-stats.py
#!/usr/bin/env python3

# forked from https://github.com/AllenCellModeling/nvidia-docker-stats and modified

import subprocess
import io
import csv
import collections


def commandexists(shellcommand):
    status, output = subprocess.getstatusoutput(shellcommand)
    exists = status == 0
    if not exists:
        print("Could not execute: {0}".format(shellcommand))
    return exists


def command(args):
    return subprocess.check_output(args).decode()


def csvtodictdict(csvdata, colnames, keycols, fmtcols={}):
    '''
    Returns a dict of dicts from csv file with specified column names and primary key column
    accepts and optional element formatting per column as a dictionary of format functions
    '''
    fmtcols = collections.defaultdict(lambda: lambda x: x, **fmtcols)
    d = {}
    rows = csv.reader(csvdata)
    for row in rows:
        drow = {colname: fmtcols[colname](val) for colname, val in zip(colnames, row)}
        if isinstance(keycols, str):
            key = drow.pop(keycols)
        else:
            key = tuple([drow.pop(keycol) for keycol in keycols])
        d[key] = drow
    return d


def csvheaderargs(fmtcol, cols):
    return ",".join([fmtcol.format(col) for col in cols])


def commandtodictdict(baseargs, cols, keycols=None, queryargfmt="{0}", colargfmt="{0}", outputfmt={}, skipheader=False):
    queryarg = queryargfmt.format(csvheaderargs(colargfmt, cols))
    args = baseargs+[queryarg]
    csvoutput = io.StringIO(command(args))
    if skipheader:
        csvoutput.readline()
    if keycols is None:
        keycols = cols[0]
    return csvtodictdict(csvoutput, cols, keycols, fmtcols=outputfmt)


def renamekeys(d, names):
    '''
    updates key names in d based on dict of old/new name pairs
    returning resulting updated dict
    '''
    for oldname, newname in names.items():
        d[newname] = d.pop(oldname)
    return d


def main():
    # get results of all commands without container arguments
    dockerps = commandtodictdict(['docker', 'ps', '--format'],
                                 ['ID', 'Names', 'Image', 'Ports'],
                                 keycols='ID',
                                 queryargfmt="'{0}'",
                                 colargfmt="{{{{.{0}}}}}",
                                 outputfmt={'ID': lambda s: s[1:]})
    dockerstats = commandtodictdict(['docker', 'stats', '--no-stream', '--format'],
                                    ['Container', 'MemUsage', 'CPUPerc'],
                                    keycols='Container',
                                    queryargfmt="'{0}'",
                                    colargfmt="{{{{.{0}}}}}",
                                    outputfmt={'Container': lambda s: s[1:]})
    unitstats = commandtodictdict(['nvidia-smi', '--format=csv'],
                                  ['gpu_uuid', 'utilization.gpu', 'utilization.memory'],
                                  keycols='gpu_uuid',
                                  queryargfmt="--query-gpu={0}",
                                  outputfmt={'gpu_uuid': lambda s: s.lstrip()},
                                  skipheader=True)
    unitprocstats = commandtodictdict(['nvidia-smi', '--format=csv'],
                                      ['pid', 'process_name', 'gpu_uuid', 'used_memory'],
                                      keycols=['pid', 'gpu_uuid'],
                                      queryargfmt="--query-compute-apps={0}",
                                      outputfmt={'gpu_uuid': lambda s: s.lstrip()},
                                      skipheader=True)

    # map gpu_uuids to short ids in unit info rename columns
    shortunitids = {gpu_uuid: "{0}".format(shortid) for gpu_uuid, shortid in zip(unitstats.keys(), range(len(unitstats)))}
    colnames = {'utilization.gpu': 'used_gpu'}
    unitstats = {shortunitids[gpu_uuid]: renamekeys(stats, colnames) for gpu_uuid, stats in unitstats.items()}
    unitprocstats = {(pid, shortunitids[gpu_uuid]): stats for (pid, gpu_uuid), stats in unitprocstats.items()}

    # display fmt data
    basedisplaycols = collections.OrderedDict([('Container', 12),
                                               ('Names', 18)])
    optdisplaycols = collections.OrderedDict([('pid', 7),
                                              ('gpu_uuid', 8),
                                              ('used_memory', 12),
                                              ('used_gpu', 9)])
    displaycols = collections.OrderedDict(list(basedisplaycols.items()) +
                                          list(optdisplaycols.items()))

    # display fmt strings
    basedisplayfmt = '\t'.join(['{{{0}:{1}.{1}}}'.format(col, width) for col, width in basedisplaycols.items()])
    optdisplayfmt = '\t'.join(['{{{0}:{1}.{1}}}'.format(col, width) for col, width in optdisplaycols.items()])
    displayfmt = '\t'.join([basedisplayfmt, optdisplayfmt])

    # print rows of relevant container processes
    # (everything below a bit janky in terms of argument expectations and generalization)
    dockerall = {container: {**dockerps[container], **dockerstats[container]} for container in dockerstats.keys()}
    someunitsactive = False
    print(displayfmt.format(**{col: col for col in displaycols.keys()}))

    for container, dockerinfo in dockerall.items():
        # very particular incantation needed here for top options to function correctly:
        # https://www.projectatomic.io/blog/2016/01/understanding-docker-top-and-ps/
        pids = command(['docker', 'top', container, '-eo', 'pid']).split('\n')[1:-1]  # obviously could be a bit brittle

        containerunitstatslist = [((proc, unit), stats) for (proc, unit), stats in sorted(unitprocstats.items()) if proc in pids]
        containerunitstats = collections.OrderedDict(containerunitstatslist)

        if containerunitstats:
            someunitsactive = True
            basedisplaystr = basedisplayfmt.format(Container=container, **dockerinfo)
            print(basedisplaystr)
            for (pid, gpu_uuid), stats in containerunitstats.items():
                print(optdisplayfmt.rjust(99).format(pid=pid, gpu_uuid=gpu_uuid, **stats, **unitstats[gpu_uuid]))
    if not someunitsactive:
        print("\n\t\t no gpu units being used by docker containers ")


if __name__ == '__main__':
    # check for existence of docker and nvidia-smi commands
    if commandexists('docker') and commandexists('nvidia-smi'):
        main()
    else:
        print('Command(s) not found')
	#!/usr/bin/env python3

	# forked from https://github.com/AllenCellModeling/nvidia-docker-stats and modified

	import subprocess
	import io
	import csv
	import collections


	def commandexists(shellcommand):
	status, output = subprocess.getstatusoutput(shellcommand)
	exists = status == 0
	if not exists:
	print("Could not execute: {0}".format(shellcommand))
	return exists


	def command(args):
	return subprocess.check_output(args).decode()


	def csvtodictdict(csvdata, colnames, keycols, fmtcols={}):
	'''
	Returns a dict of dicts from csv file with specified column names and primary key column
	accepts and optional element formatting per column as a dictionary of format functions
	'''
	fmtcols = collections.defaultdict(lambda: lambda x: x, **fmtcols)
	d = {}
	rows = csv.reader(csvdata)
	for row in rows:
	drow = {colname: fmtcols[colname](val) for colname, val in zip(colnames, row)}
	if isinstance(keycols, str):
	key = drow.pop(keycols)
	else:
	key = tuple([drow.pop(keycol) for keycol in keycols])
	d[key] = drow
	return d


	def csvheaderargs(fmtcol, cols):
	return ",".join([fmtcol.format(col) for col in cols])


	def commandtodictdict(baseargs, cols, keycols=None, queryargfmt="{0}", colargfmt="{0}", outputfmt={}, skipheader=False):
	queryarg = queryargfmt.format(csvheaderargs(colargfmt, cols))
	args = baseargs+[queryarg]
	csvoutput = io.StringIO(command(args))
	if skipheader:
	csvoutput.readline()
	if keycols is None:
	keycols = cols[0]
	return csvtodictdict(csvoutput, cols, keycols, fmtcols=outputfmt)


	def renamekeys(d, names):
	'''
	updates key names in d based on dict of old/new name pairs
	returning resulting updated dict
	'''
	for oldname, newname in names.items():
	d[newname] = d.pop(oldname)
	return d


	def main():
	# get results of all commands without container arguments
	dockerps = commandtodictdict(['docker', 'ps', '--format'],
	['ID', 'Names', 'Image', 'Ports'],
	keycols='ID',
	queryargfmt="'{0}'",
	colargfmt="{{{{.{0}}}}}",
	outputfmt={'ID': lambda s: s[1:]})
	dockerstats = commandtodictdict(['docker', 'stats', '--no-stream', '--format'],
	['Container', 'MemUsage', 'CPUPerc'],
	keycols='Container',
	queryargfmt="'{0}'",
	colargfmt="{{{{.{0}}}}}",
	outputfmt={'Container': lambda s: s[1:]})
	unitstats = commandtodictdict(['nvidia-smi', '--format=csv'],
	['gpu_uuid', 'utilization.gpu', 'utilization.memory'],
	keycols='gpu_uuid',
	queryargfmt="--query-gpu={0}",
	outputfmt={'gpu_uuid': lambda s: s.lstrip()},
	skipheader=True)
	unitprocstats = commandtodictdict(['nvidia-smi', '--format=csv'],
	['pid', 'process_name', 'gpu_uuid', 'used_memory'],
	keycols=['pid', 'gpu_uuid'],
	queryargfmt="--query-compute-apps={0}",
	outputfmt={'gpu_uuid': lambda s: s.lstrip()},
	skipheader=True)

	# map gpu_uuids to short ids in unit info rename columns
	shortunitids = {gpu_uuid: "{0}".format(shortid) for gpu_uuid, shortid in zip(unitstats.keys(), range(len(unitstats)))}
	colnames = {'utilization.gpu': 'used_gpu'}
	unitstats = {shortunitids[gpu_uuid]: renamekeys(stats, colnames) for gpu_uuid, stats in unitstats.items()}
	unitprocstats = {(pid, shortunitids[gpu_uuid]): stats for (pid, gpu_uuid), stats in unitprocstats.items()}

	# display fmt data
	basedisplaycols = collections.OrderedDict([('Container', 12),
	('Names', 18)])
	optdisplaycols = collections.OrderedDict([('pid', 7),
	('gpu_uuid', 8),
	('used_memory', 12),
	('used_gpu', 9)])
	displaycols = collections.OrderedDict(list(basedisplaycols.items()) +
	list(optdisplaycols.items()))

	# display fmt strings
	basedisplayfmt = '\t'.join(['{{{0}:{1}.{1}}}'.format(col, width) for col, width in basedisplaycols.items()])
	optdisplayfmt = '\t'.join(['{{{0}:{1}.{1}}}'.format(col, width) for col, width in optdisplaycols.items()])
	displayfmt = '\t'.join([basedisplayfmt, optdisplayfmt])

	# print rows of relevant container processes
	# (everything below a bit janky in terms of argument expectations and generalization)
	dockerall = {container: {dockerps[container], dockerstats[container]} for container in dockerstats.keys()}
	someunitsactive = False
	print(displayfmt.format(**{col: col for col in displaycols.keys()}))

	for container, dockerinfo in dockerall.items():
	# very particular incantation needed here for top options to function correctly:
	# https://www.projectatomic.io/blog/2016/01/understanding-docker-top-and-ps/
	pids = command(['docker', 'top', container, '-eo', 'pid']).split('\n')[1:-1] # obviously could be a bit brittle

	containerunitstatslist = [((proc, unit), stats) for (proc, unit), stats in sorted(unitprocstats.items()) if proc in pids]
	containerunitstats = collections.OrderedDict(containerunitstatslist)

	if containerunitstats:
	someunitsactive = True
	basedisplaystr = basedisplayfmt.format(Container=container, **dockerinfo)
	print(basedisplaystr)
	for (pid, gpu_uuid), stats in containerunitstats.items():
	print(optdisplayfmt.rjust(99).format(pid=pid, gpu_uuid=gpu_uuid, stats, unitstats[gpu_uuid]))
	if not someunitsactive:
	print("\n\t\t no gpu units being used by docker containers ")


	if __name__ == '__main__':
	# check for existence of docker and nvidia-smi commands
	if commandexists('docker') and commandexists('nvidia-smi'):
	main()
	else:
	print('Command(s) not found')