rotemtam/pascal_to_csv.py

## pascal_to_csv.py
import os
import glob
import pandas as pd
import xml.etree.ElementTree as ET


def xml_to_csv(path):
    xml_list = []
    for xml_file in glob.glob(path + '/*.xml'):
        tree = ET.parse(xml_file)
        root = tree.getroot()
        for member in root.findall('object'):
            bbx = member.find('bndbox')
            xmin = int(bbx.find('xmin').text)
            ymin = int(bbx.find('ymin').text)
            xmax = int(bbx.find('xmax').text)
            ymax = int(bbx.find('ymax').text)
            label = member.find('name').text

            value = (root.find('filename').text,
                     int(root.find('size')[0].text),
                     int(root.find('size')[1].text),
                     label,
                     xmin,
                     ymin,
                     xmax,
                     ymax
                     )
            xml_list.append(value)
    column_name = ['filename', 'width', 'height',
                   'class', 'xmin', 'ymin', 'xmax', 'ymax']
    xml_df = pd.DataFrame(xml_list, columns=column_name)
    return xml_df


def main():
    datasets = ['train', 'dev', 'test']
    for ds in datasets:
        image_path = os.path.join(os.getcwd(), ds, 'annotations')
        xml_df = xml_to_csv(image_path)
        xml_df.to_csv('labels_{}.csv'.format(ds), index=None)
        print('Successfully converted xml to csv.')


main()
	import os
	import glob
	import pandas as pd
	import xml.etree.ElementTree as ET


	def xml_to_csv(path):
	xml_list = []
	for xml_file in glob.glob(path + '/*.xml'):
	tree = ET.parse(xml_file)
	root = tree.getroot()
	for member in root.findall('object'):
	bbx = member.find('bndbox')
	xmin = int(bbx.find('xmin').text)
	ymin = int(bbx.find('ymin').text)
	xmax = int(bbx.find('xmax').text)
	ymax = int(bbx.find('ymax').text)
	label = member.find('name').text

	value = (root.find('filename').text,
	int(root.find('size')[0].text),
	int(root.find('size')[1].text),
	label,
	xmin,
	ymin,
	xmax,
	ymax
	)
	xml_list.append(value)
	column_name = ['filename', 'width', 'height',
	'class', 'xmin', 'ymin', 'xmax', 'ymax']
	xml_df = pd.DataFrame(xml_list, columns=column_name)
	return xml_df


	def main():
	datasets = ['train', 'dev', 'test']
	for ds in datasets:
	image_path = os.path.join(os.getcwd(), ds, 'annotations')
	xml_df = xml_to_csv(image_path)
	xml_df.to_csv('labels_{}.csv'.format(ds), index=None)
	print('Successfully converted xml to csv.')


	main()
filename	width	height	class	xmin	ymin	xmax	ymax
Scenario_9_3_1_crouching75ft-0001.jpg	3840	2160	pedestrian	381	527	453	617
Scenario_9_3_1_crouching75ft-0001.jpg	3840	2160	pedestrian	903	52	981	163
Scenario_9_3_1_crouching75ft-0001.jpg	3840	2160	pedestrian	1285	388	1363	518
Scenario_9_3_1_crouching75ft-0001.jpg	3840	2160	pedestrian	2519	563	2612	656
Scenario_9_3_1_crouching75ft-0002.jpg	3840	2160	pedestrian	381	530	474	629
Scenario_9_3_1_crouching75ft-0002.jpg	3840	2160	pedestrian	912	67	1000	175