AruniRC/convert_face_to_coco.py

## convert_face_to_coco.py
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from __future__ import unicode_literals

import argparse
import h5py
import json
import os
import scipy.misc
import sys
import re
import fnmatch
import datetime
from PIL import Image
import numpy as np


def add_path(path):
    if path not in sys.path:
        sys.path.insert(0, path)

this_dir = os.path.dirname(__file__)
add_path(this_dir)
# print(this_dir)
add_path(os.path.join(this_dir, '..', '..'))

import utils
import utils.boxes as bboxs_util
import utils.face_utils as face_util


# INFO = {
#     "description": "WIDER Face Dataset",
#     "url": "http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/",
#     "version": "0.1.0",
#     "year": 2018,
#     "contributor": "umass vision",
#     "date_created": datetime.datetime.utcnow().isoformat(' ')
# }

# LICENSES = [
#     {
#         "id": 1,
#         "name": "placeholder",
#         "url": "placeholder"
#     }
# ]

# CATEGORIES = [
#     {
#         'id': 1,
#         'name': 'face',
#         'supercategory': 'face',
#     },
# ]


def parse_args():
    parser = argparse.ArgumentParser(description='Convert dataset')
    parser.add_argument(
        '--dataset', help="wider", default='wider', type=str)
    parser.add_argument(
        '--outdir', help="output dir for json files",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--datadir', help="data dir for annotations to be converted",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--imdir', help="root directory for loading dataset images",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--annotfile', help="directly specify the annotations file",
        default='', type=str)
    # if len(sys.argv) == 1:
    #     parser.print_help()
    #     sys.exit(1)
    return parser.parse_args()


def convert_wider_annots(data_dir, out_dir, data_set='WIDER'):
    """Convert from WIDER FDDB-style format to COCO bounding box"""

    json_name = 'wider_face_train_annot_coco_style.json'
    img_id = 0
    ann_id = 0
    cat_id = 1

    print('Starting %s' % data_set)
    ann_dict = {}
    categories = [{"id": 1, "name": 'face'}]
    images = []
    annotations = []
    ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
    wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

    for filename in wider_annot_dict.keys():
        if len(images) % 50 == 0:
            print("Processed %s images, %s annotations" % (
                len(images), len(annotations)))

        image = {}
        image['id'] = img_id
        img_id += 1
        im = Image.open(os.path.join(data_dir, filename))
        image['width'] = im.height
        image['height'] = im.width
        image['file_name'] = filename
        images.append(image)

        for gt_bbox in wider_annot_dict[filename]:
            ann = {}
            ann['id'] = ann_id
            ann_id += 1
            ann['image_id'] = image['id']
            ann['segmentation'] = []
            ann['category_id'] = cat_id # 1:"face" for WIDER
            ann['iscrowd'] = 0
            ann['area'] = gt_bbox[2] * gt_bbox[3]
            ann['bbox'] = gt_bbox
            annotations.append(ann)

    ann_dict['images'] = images
    ann_dict['categories'] = categories
    ann_dict['annotations'] = annotations
    print("Num categories: %s" % len(categories))
    print("Num images: %s" % len(images))
    print("Num annotations: %s" % len(annotations))
    with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
        outfile.write(json.dumps(ann_dict))


def convert_cs6_annots(ann_file, im_dir, out_dir, data_set='CS6-subset'):
    """Convert from WIDER FDDB-style format to COCO bounding box"""

    if data_set=='CS6-subset':
        json_name = 'cs6-subset_face_train_annot_coco_style.json'
        # ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
    else:
        raise NotImplementedError


    img_id = 0
    ann_id = 0
    cat_id = 1

    print('Starting %s' % data_set)
    ann_dict = {}
    categories = [{"id": 1, "name": 'face'}]
    images = []
    annotations = []

    wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

    for filename in wider_annot_dict.keys():
        if len(images) % 50 == 0:
            print("Processed %s images, %s annotations" % (
                len(images), len(annotations)))

        image = {}
        image['id'] = img_id
        img_id += 1
        im = Image.open(os.path.join(im_dir, filename))
        image['width'] = im.height
        image['height'] = im.width
        image['file_name'] = filename
        images.append(image)

        for gt_bbox in wider_annot_dict[filename]:
            ann = {}
            ann['id'] = ann_id
            ann_id += 1
            ann['image_id'] = image['id']
            ann['segmentation'] = []
            ann['category_id'] = cat_id # 1:"face" for WIDER
            ann['iscrowd'] = 0
            ann['area'] = gt_bbox[2] * gt_bbox[3]
            ann['bbox'] = gt_bbox
            annotations.append(ann)

    ann_dict['images'] = images
    ann_dict['categories'] = categories
    ann_dict['annotations'] = annotations
    print("Num categories: %s" % len(categories))
    print("Num images: %s" % len(images))
    print("Num annotations: %s" % len(annotations))
    with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
        outfile.write(json.dumps(ann_dict))


if __name__ == '__main__':
    args = parse_args()
    if args.dataset == "wider":
        convert_wider_annots(args.datadir, args.outdir)
    if args.dataset == "cs6-subset":
        convert_cs6_annots(args.annotfile, args.imdir,
                           args.outdir, data_set='CS6-subset')
    else:
        print("Dataset not supported: %s" % args.dataset)

## gistfile1.txt
from __future__ import absolute_import
from __future__ import division
from __future__ import print_function
from __future__ import unicode_literals

import argparse
import h5py
import json
import os
import scipy.misc
import sys
import re
import fnmatch
import datetime
from PIL import Image
import numpy as np


def add_path(path):
    if path not in sys.path:
        sys.path.insert(0, path)

this_dir = os.path.dirname(__file__)
add_path(this_dir)
# print(this_dir)
add_path(os.path.join(this_dir, '..', '..'))

import utils
import utils.boxes as bboxs_util
import utils.face_utils as face_util


# INFO = {
#     "description": "WIDER Face Dataset",
#     "url": "http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/",
#     "version": "0.1.0",
#     "year": 2018,
#     "contributor": "umass vision",
#     "date_created": datetime.datetime.utcnow().isoformat(' ')
# }

# LICENSES = [
#     {
#         "id": 1,
#         "name": "placeholder",
#         "url": "placeholder"
#     }
# ]

# CATEGORIES = [
#     {
#         'id': 1,
#         'name': 'face',
#         'supercategory': 'face',
#     },
# ]


def parse_args():
    parser = argparse.ArgumentParser(description='Convert dataset')
    parser.add_argument(
        '--dataset', help="wider", default='wider', type=str)
    parser.add_argument(
        '--outdir', help="output dir for json files",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--datadir', help="data dir for annotations to be converted",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--imdir', help="root directory for loading dataset images",
        default='data/WIDER', type=str)
    parser.add_argument(
        '--annotfile', help="directly specify the annotations file",
        default='', type=str)
    # if len(sys.argv) == 1:
    #     parser.print_help()
    #     sys.exit(1)
    return parser.parse_args()


def convert_wider_annots(data_dir, out_dir, data_set='WIDER'):
    """Convert from WIDER FDDB-style format to COCO bounding box"""

    json_name = 'wider_face_train_annot_coco_style.json'
    img_id = 0
    ann_id = 0
    cat_id = 1

    print('Starting %s' % data_set)
    ann_dict = {}
    categories = [{"id": 1, "name": 'face'}]
    images = []
    annotations = []
    ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
    wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

    for filename in wider_annot_dict.keys():
        if len(images) % 50 == 0:
            print("Processed %s images, %s annotations" % (
                len(images), len(annotations)))

        image = {}
        image['id'] = img_id
        img_id += 1
        im = Image.open(os.path.join(data_dir, filename))
        image['width'] = im.height
        image['height'] = im.width
        image['file_name'] = filename
        images.append(image)

        for gt_bbox in wider_annot_dict[filename]:
            ann = {}
            ann['id'] = ann_id
            ann_id += 1
            ann['image_id'] = image['id']
            ann['segmentation'] = []
            ann['category_id'] = cat_id # 1:"face" for WIDER
            ann['iscrowd'] = 0
            ann['area'] = gt_bbox[2] * gt_bbox[3]
            ann['bbox'] = gt_bbox
            annotations.append(ann)

    ann_dict['images'] = images
    ann_dict['categories'] = categories
    ann_dict['annotations'] = annotations
    print("Num categories: %s" % len(categories))
    print("Num images: %s" % len(images))
    print("Num annotations: %s" % len(annotations))
    with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
        outfile.write(json.dumps(ann_dict))


def convert_cs6_annots(ann_file, im_dir, out_dir, data_set='CS6-subset'):
    """Convert from WIDER FDDB-style format to COCO bounding box"""

    if data_set=='CS6-subset':
        json_name = 'cs6-subset_face_train_annot_coco_style.json'
        # ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
    else:
        raise NotImplementedError


    img_id = 0
    ann_id = 0
    cat_id = 1

    print('Starting %s' % data_set)
    ann_dict = {}
    categories = [{"id": 1, "name": 'face'}]
    images = []
    annotations = []

    wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

    for filename in wider_annot_dict.keys():
        if len(images) % 50 == 0:
            print("Processed %s images, %s annotations" % (
                len(images), len(annotations)))

        image = {}
        image['id'] = img_id
        img_id += 1
        im = Image.open(os.path.join(im_dir, filename))
        image['width'] = im.height
        image['height'] = im.width
        image['file_name'] = filename
        images.append(image)

        for gt_bbox in wider_annot_dict[filename]:
            ann = {}
            ann['id'] = ann_id
            ann_id += 1
            ann['image_id'] = image['id']
            ann['segmentation'] = []
            ann['category_id'] = cat_id # 1:"face" for WIDER
            ann['iscrowd'] = 0
            ann['area'] = gt_bbox[2] * gt_bbox[3]
            ann['bbox'] = gt_bbox
            annotations.append(ann)

    ann_dict['images'] = images
    ann_dict['categories'] = categories
    ann_dict['annotations'] = annotations
    print("Num categories: %s" % len(categories))
    print("Num images: %s" % len(images))
    print("Num annotations: %s" % len(annotations))
    with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
        outfile.write(json.dumps(ann_dict))


if __name__ == '__main__':
    args = parse_args()
    if args.dataset == "wider":
        convert_wider_annots(args.datadir, args.outdir)
    if args.dataset == "cs6-subset":
        convert_cs6_annots(args.annotfile, args.imdir,
                           args.outdir, data_set='CS6-subset')
    else:
        print("Dataset not supported: %s" % args.dataset)
	from __future__ import absolute_import
	from __future__ import division
	from __future__ import print_function
	from __future__ import unicode_literals

	import argparse
	import h5py
	import json
	import os
	import scipy.misc
	import sys
	import re
	import fnmatch
	import datetime
	from PIL import Image
	import numpy as np


	def add_path(path):
	if path not in sys.path:
	sys.path.insert(0, path)

	this_dir = os.path.dirname(__file__)
	add_path(this_dir)
	# print(this_dir)
	add_path(os.path.join(this_dir, '..', '..'))

	import utils
	import utils.boxes as bboxs_util
	import utils.face_utils as face_util


	# INFO = {
	# "description": "WIDER Face Dataset",
	# "url": "http://mmlab.ie.cuhk.edu.hk/projects/WIDERFace/",
	# "version": "0.1.0",
	# "year": 2018,
	# "contributor": "umass vision",
	# "date_created": datetime.datetime.utcnow().isoformat(' ')
	# }

	# LICENSES = [
	# {
	# "id": 1,
	# "name": "placeholder",
	# "url": "placeholder"
	# }
	# ]

	# CATEGORIES = [
	# {
	# 'id': 1,
	# 'name': 'face',
	# 'supercategory': 'face',
	# },
	# ]



	def parse_args():
	parser = argparse.ArgumentParser(description='Convert dataset')
	parser.add_argument(
	'--dataset', help="wider", default='wider', type=str)
	parser.add_argument(
	'--outdir', help="output dir for json files",
	default='data/WIDER', type=str)
	parser.add_argument(
	'--datadir', help="data dir for annotations to be converted",
	default='data/WIDER', type=str)
	parser.add_argument(
	'--imdir', help="root directory for loading dataset images",
	default='data/WIDER', type=str)
	parser.add_argument(
	'--annotfile', help="directly specify the annotations file",
	default='', type=str)
	# if len(sys.argv) == 1:
	# parser.print_help()
	# sys.exit(1)
	return parser.parse_args()



	def convert_wider_annots(data_dir, out_dir, data_set='WIDER'):
	"""Convert from WIDER FDDB-style format to COCO bounding box"""

	json_name = 'wider_face_train_annot_coco_style.json'
	img_id = 0
	ann_id = 0
	cat_id = 1

	print('Starting %s' % data_set)
	ann_dict = {}
	categories = [{"id": 1, "name": 'face'}]
	images = []
	annotations = []
	ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
	wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

	for filename in wider_annot_dict.keys():
	if len(images) % 50 == 0:
	print("Processed %s images, %s annotations" % (
	len(images), len(annotations)))

	image = {}
	image['id'] = img_id
	img_id += 1
	im = Image.open(os.path.join(data_dir, filename))
	image['width'] = im.height
	image['height'] = im.width
	image['file_name'] = filename
	images.append(image)

	for gt_bbox in wider_annot_dict[filename]:
	ann = {}
	ann['id'] = ann_id
	ann_id += 1
	ann['image_id'] = image['id']
	ann['segmentation'] = []
	ann['category_id'] = cat_id # 1:"face" for WIDER
	ann['iscrowd'] = 0
	ann['area'] = gt_bbox[2] * gt_bbox[3]
	ann['bbox'] = gt_bbox
	annotations.append(ann)

	ann_dict['images'] = images
	ann_dict['categories'] = categories
	ann_dict['annotations'] = annotations
	print("Num categories: %s" % len(categories))
	print("Num images: %s" % len(images))
	print("Num annotations: %s" % len(annotations))
	with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
	outfile.write(json.dumps(ann_dict))



	def convert_cs6_annots(ann_file, im_dir, out_dir, data_set='CS6-subset'):
	"""Convert from WIDER FDDB-style format to COCO bounding box"""

	if data_set=='CS6-subset':
	json_name = 'cs6-subset_face_train_annot_coco_style.json'
	# ann_file = os.path.join(data_dir, 'wider_face_train_annot.txt')
	else:
	raise NotImplementedError


	img_id = 0
	ann_id = 0
	cat_id = 1

	print('Starting %s' % data_set)
	ann_dict = {}
	categories = [{"id": 1, "name": 'face'}]
	images = []
	annotations = []

	wider_annot_dict = face_util.parse_wider_gt(ann_file) # [im-file] = [[x,y,w,h], ...]

	for filename in wider_annot_dict.keys():
	if len(images) % 50 == 0:
	print("Processed %s images, %s annotations" % (
	len(images), len(annotations)))

	image = {}
	image['id'] = img_id
	img_id += 1
	im = Image.open(os.path.join(im_dir, filename))
	image['width'] = im.height
	image['height'] = im.width
	image['file_name'] = filename
	images.append(image)

	for gt_bbox in wider_annot_dict[filename]:
	ann = {}
	ann['id'] = ann_id
	ann_id += 1
	ann['image_id'] = image['id']
	ann['segmentation'] = []
	ann['category_id'] = cat_id # 1:"face" for WIDER
	ann['iscrowd'] = 0
	ann['area'] = gt_bbox[2] * gt_bbox[3]
	ann['bbox'] = gt_bbox
	annotations.append(ann)

	ann_dict['images'] = images
	ann_dict['categories'] = categories
	ann_dict['annotations'] = annotations
	print("Num categories: %s" % len(categories))
	print("Num images: %s" % len(images))
	print("Num annotations: %s" % len(annotations))
	with open(os.path.join(out_dir, json_name), 'w', encoding='utf8') as outfile:
	outfile.write(json.dumps(ann_dict))



	if __name__ == '__main__':
	args = parse_args()
	if args.dataset == "wider":
	convert_wider_annots(args.datadir, args.outdir)
	if args.dataset == "cs6-subset":
	convert_cs6_annots(args.annotfile, args.imdir,
	args.outdir, data_set='CS6-subset')
	else:
	print("Dataset not supported: %s" % args.dataset)