kracwarlock/demo_cocoeval.py

## demo_cocoeval.py
from pycocoevalcap.tokenizer.ptbtokenizer import PTBTokenizer
from pycocoevalcap.bleu.bleu import Bleu
from pycocoevalcap.meteor.meteor import Meteor
from pycocoevalcap.rouge.rouge import Rouge
from pycocoevalcap.cider.cider import Cider

class COCOEvalCap:
    def __init__(self,images,gts,res):
        self.evalImgs = []
        self.eval = {}
        self.imgToEval = {}
        self.params = {'image_id': images}
        self.gts = gts
        self.res = res

    def evaluate(self):
        imgIds = self.params['image_id']
        gts = self.gts
        res = self.res

        # =================================================
        # Set up scorers
        # =================================================
        print 'tokenization...'
        tokenizer = PTBTokenizer()
        gts  = tokenizer.tokenize(gts)
        res = tokenizer.tokenize(res)

        # =================================================
        # Set up scorers
        # =================================================
        print 'setting up scorers...'
        scorers = [
            (Bleu(4), ["Bleu_1", "Bleu_2", "Bleu_3", "Bleu_4"]),
            (Meteor(),"METEOR"),
            (Rouge(), "ROUGE_L"),
            (Cider(), "CIDEr")
        ]

        # =================================================
        # Compute scores
        # =================================================
        eval = {}
        for scorer, method in scorers:
            print 'computing %s score...'%(scorer.method())
            score, scores = scorer.compute_score(gts, res)
            if type(method) == list:
                for sc, scs, m in zip(score, scores, method):
                    self.setEval(sc, m)
                    self.setImgToEvalImgs(scs, imgIds, m)
                    print "%s: %0.3f"%(m, sc)
            else:
                self.setEval(score, method)
                self.setImgToEvalImgs(scores, imgIds, method)
                print "%s: %0.3f"%(method, score)
        self.setEvalImgs()

    def setEval(self, score, method):
        self.eval[method] = score

    def setImgToEvalImgs(self, scores, imgIds, method):
        for imgId, score in zip(imgIds, scores):
            if not imgId in self.imgToEval:
                self.imgToEval[imgId] = {}
                self.imgToEval[imgId]["image_id"] = imgId
            self.imgToEval[imgId][method] = score

    def setEvalImgs(self):
        self.evalImgs = [eval for imgId, eval in self.imgToEval.items()]

def calculate_metrics(rng,datasetGTS,datasetRES):
    imgIds = rng
    gts = {}
    res = {}

    imgToAnnsGTS = {ann['image_id']: [] for ann in datasetGTS['annotations']}
    for ann in datasetGTS['annotations']:
        imgToAnnsGTS[ann['image_id']] += [ann]

    imgToAnnsRES = {ann['image_id']: [] for ann in datasetRES['annotations']}
    for ann in datasetRES['annotations']:
        imgToAnnsRES[ann['image_id']] += [ann]

    for imgId in imgIds:
        gts[imgId] = imgToAnnsGTS[imgId]
        res[imgId] = imgToAnnsRES[imgId]

    evalObj = COCOEvalCap(imgIds,gts,res)
    evalObj.evaluate()
    return evalObj.eval

if __name__ == '__main__':
    rng = range(2)
    datasetGTS = {
        'annotations': [{u'image_id': 0, u'caption': u'the man is playing a guitar'},
                        {u'image_id': 0, u'caption': u'a man is playing a guitar'},
                        {u'image_id': 1, u'caption': u'a woman is slicing cucumbers'},
                        {u'image_id': 1, u'caption': u'the woman is slicing cucumbers'},
                        {u'image_id': 1, u'caption': u'a woman is cutting cucumbers'}]
        }
    datasetRES = {
        'annotations': [{u'image_id': 0, u'caption': u'man is playing guitar'},
                        {u'image_id': 1, u'caption': u'a woman is cutting vegetables'}]
        }
    print calculate_metrics(rng,datasetGTS,datasetRES)
	from pycocoevalcap.tokenizer.ptbtokenizer import PTBTokenizer
	from pycocoevalcap.bleu.bleu import Bleu
	from pycocoevalcap.meteor.meteor import Meteor
	from pycocoevalcap.rouge.rouge import Rouge
	from pycocoevalcap.cider.cider import Cider

	class COCOEvalCap:
	def __init__(self,images,gts,res):
	self.evalImgs = []
	self.eval = {}
	self.imgToEval = {}
	self.params = {'image_id': images}
	self.gts = gts
	self.res = res

	def evaluate(self):
	imgIds = self.params['image_id']
	gts = self.gts
	res = self.res

	# =================================================
	# Set up scorers
	# =================================================
	print 'tokenization...'
	tokenizer = PTBTokenizer()
	gts = tokenizer.tokenize(gts)
	res = tokenizer.tokenize(res)

	# =================================================
	# Set up scorers
	# =================================================
	print 'setting up scorers...'
	scorers = [
	(Bleu(4), ["Bleu_1", "Bleu_2", "Bleu_3", "Bleu_4"]),
	(Meteor(),"METEOR"),
	(Rouge(), "ROUGE_L"),
	(Cider(), "CIDEr")
	]

	# =================================================
	# Compute scores
	# =================================================
	eval = {}
	for scorer, method in scorers:
	print 'computing %s score...'%(scorer.method())
	score, scores = scorer.compute_score(gts, res)
	if type(method) == list:
	for sc, scs, m in zip(score, scores, method):
	self.setEval(sc, m)
	self.setImgToEvalImgs(scs, imgIds, m)
	print "%s: %0.3f"%(m, sc)
	else:
	self.setEval(score, method)
	self.setImgToEvalImgs(scores, imgIds, method)
	print "%s: %0.3f"%(method, score)
	self.setEvalImgs()

	def setEval(self, score, method):
	self.eval[method] = score

	def setImgToEvalImgs(self, scores, imgIds, method):
	for imgId, score in zip(imgIds, scores):
	if not imgId in self.imgToEval:
	self.imgToEval[imgId] = {}
	self.imgToEval[imgId]["image_id"] = imgId
	self.imgToEval[imgId][method] = score

	def setEvalImgs(self):
	self.evalImgs = [eval for imgId, eval in self.imgToEval.items()]

	def calculate_metrics(rng,datasetGTS,datasetRES):
	imgIds = rng
	gts = {}
	res = {}

	imgToAnnsGTS = {ann['image_id']: [] for ann in datasetGTS['annotations']}
	for ann in datasetGTS['annotations']:
	imgToAnnsGTS[ann['image_id']] += [ann]

	imgToAnnsRES = {ann['image_id']: [] for ann in datasetRES['annotations']}
	for ann in datasetRES['annotations']:
	imgToAnnsRES[ann['image_id']] += [ann]

	for imgId in imgIds:
	gts[imgId] = imgToAnnsGTS[imgId]
	res[imgId] = imgToAnnsRES[imgId]

	evalObj = COCOEvalCap(imgIds,gts,res)
	evalObj.evaluate()
	return evalObj.eval

	if __name__ == '__main__':
	rng = range(2)
	datasetGTS = {
	'annotations': [{u'image_id': 0, u'caption': u'the man is playing a guitar'},
	{u'image_id': 0, u'caption': u'a man is playing a guitar'},
	{u'image_id': 1, u'caption': u'a woman is slicing cucumbers'},
	{u'image_id': 1, u'caption': u'the woman is slicing cucumbers'},
	{u'image_id': 1, u'caption': u'a woman is cutting cucumbers'}]
	}
	datasetRES = {
	'annotations': [{u'image_id': 0, u'caption': u'man is playing guitar'},
	{u'image_id': 1, u'caption': u'a woman is cutting vegetables'}]
	}
	print calculate_metrics(rng,datasetGTS,datasetRES)