kmorel/birthdays.py

## birthdays.py
import random

maxBirthdays = 6
numDays = 365
numTrials = 100000
maxGroupSize = 1000

def BirthdayExperiment():
    birthdays = [0] * numDays
    numToDuplicates = {}
    r = random.Random()
    numPeople = 0
    while True:
        numPeople += 1
        nextBirthday = r.randint(0,numDays-1)
        birthdays[nextBirthday] += 1
        numBirthdays = birthdays[nextBirthday]
        if (numBirthdays > 1) and (not numBirthdays in numToDuplicates):
            numToDuplicates[numBirthdays] = numPeople
            if numBirthdays == maxBirthdays:
                break
    return numToDuplicates

random.seed()

cumDistFunctions = {}
for i in range(2,maxBirthdays+1):
    cumDistFunctions[i] = [0] * (maxGroupSize+1)

for trial in range(numTrials):
    numToDuplicates= BirthdayExperiment()
    for i in range(2,maxBirthdays+1):
        for j in range(numToDuplicates[i],maxGroupSize+1):
            cumDistFunctions[i][j] += 1


line = "# People,2 analytic"
for i in range(2,maxBirthdays+1):
    line = "%s,%d same" % (line, i)
print line

analytic = 1.0
for numPeople in range(1,maxGroupSize+1):
    if numPeople <= numDays:
        analytic *= float(numDays-numPeople+1)/numDays
    line = "%d,%f" % (numPeople, 1-analytic)
    for i in range(2,maxBirthdays+1):
        line = "%s,%f" % (line, float(cumDistFunctions[i][numPeople])/numTrials)
    print line
	import random

	maxBirthdays = 6
	numDays = 365
	numTrials = 100000
	maxGroupSize = 1000

	def BirthdayExperiment():
	birthdays = [0] * numDays
	numToDuplicates = {}
	r = random.Random()
	numPeople = 0
	while True:
	numPeople += 1
	nextBirthday = r.randint(0,numDays-1)
	birthdays[nextBirthday] += 1
	numBirthdays = birthdays[nextBirthday]
	if (numBirthdays > 1) and (not numBirthdays in numToDuplicates):
	numToDuplicates[numBirthdays] = numPeople
	if numBirthdays == maxBirthdays:
	break
	return numToDuplicates

	random.seed()

	cumDistFunctions = {}
	for i in range(2,maxBirthdays+1):
	cumDistFunctions[i] = [0] * (maxGroupSize+1)

	for trial in range(numTrials):
	numToDuplicates= BirthdayExperiment()
	for i in range(2,maxBirthdays+1):
	for j in range(numToDuplicates[i],maxGroupSize+1):
	cumDistFunctions[i][j] += 1


	line = "# People,2 analytic"
	for i in range(2,maxBirthdays+1):
	line = "%s,%d same" % (line, i)
	print line

	analytic = 1.0
	for numPeople in range(1,maxGroupSize+1):
	if numPeople <= numDays:
	analytic *= float(numDays-numPeople+1)/numDays
	line = "%d,%f" % (numPeople, 1-analytic)
	for i in range(2,maxBirthdays+1):
	line = "%s,%f" % (line, float(cumDistFunctions[i][numPeople])/numTrials)
	print line