falzm/itunes2json.py

## itunes2json.py
#!/usr/bin/env python

from __future__ import print_function
from pprint import pprint

import json
import plistlib as plist
import sys


library = plist.readPlist(sys.argv[1])

for track_id, track in library['Tracks'].iteritems():
    fields = (
        'artist',
        'name',
        'album',
        'year',
        'total_time',
        'genre',
        'play_count',
        'kind',
        'total_time',
        'bit_rate',
        'size',
    )

    track = dict(map(lambda (k,v): (k.lower().replace(' ', '_'), v), track.iteritems()))

    try:
        track_fields = dict().fromkeys(fields) & track.viewkeys()
        track = {k: track[k] for k in track_fields }

        # Filter out non-music files
        if ('kind' in track.keys() and track['kind'] in ('MPEG-4 video file', 'Ringtone')) or \
           ('genre' in track.keys() and track['genre'] in ('Podcast', 'Video Games', 'Tech News')):
            continue

        # Convert years in strings (required by Elasticsearch to index it as 'date' type)
        if 'year' in track.keys():
            track['year'] = str(track['year'])

        # Convert Track durations from milliseconds to seconds
        if 'total_time' in track.keys():
            track['total_time'] = int(track['total_time'] / 1000)

        print(json.dumps(track))
    except:
        continue
	#!/usr/bin/env python

	from __future__ import print_function
	from pprint import pprint

	import json
	import plistlib as plist
	import sys


	library = plist.readPlist(sys.argv[1])

	for track_id, track in library['Tracks'].iteritems():
	fields = (
	'artist',
	'name',
	'album',
	'year',
	'total_time',
	'genre',
	'play_count',
	'kind',
	'total_time',
	'bit_rate',
	'size',
	)

	track = dict(map(lambda (k,v): (k.lower().replace(' ', '_'), v), track.iteritems()))

	try:
	track_fields = dict().fromkeys(fields) & track.viewkeys()
	track = {k: track[k] for k in track_fields }

	# Filter out non-music files
	if ('kind' in track.keys() and track['kind'] in ('MPEG-4 video file', 'Ringtone')) or \
	('genre' in track.keys() and track['genre'] in ('Podcast', 'Video Games', 'Tech News')):
	continue

	# Convert years in strings (required by Elasticsearch to index it as 'date' type)
	if 'year' in track.keys():
	track['year'] = str(track['year'])

	# Convert Track durations from milliseconds to seconds
	if 'total_time' in track.keys():
	track['total_time'] = int(track['total_time'] / 1000)

	print(json.dumps(track))
	except:
	continue