zsiv/gist:bffea1a7709076ce076e6017bd603331

## gistfile1.txt
/*
Top 10 "helpful" locations

Assumptions:
- > 100 users in location
- no null/blank location
- most helpful calculated by highest overall average answer score (subjective)
*/

WITH AnswerData AS (
	SELECT u.Id, u.[Location], AVG(p.Score) AS 'AvgAnswerScore'
	FROM dbo.Users u INNER JOIN dbo.Posts p ON u.Id = p.OwnerUserId
	WHERE p.PostTypeID = 2
		AND u.[Location] IS NOT NULL
		AND u.[Location] <> ''
	GROUP BY u.Id, u.[Location]
)

SELECT TOP 10 [Location], COUNT(*) AS [Population], AVG(AvgAnswerScore) AS AvgAnswerRep
FROM AnswerData
GROUP BY [Location]
HAVING COUNT(*) >= 100
ORDER BY AvgAnswerRep DESC


/*
Top 10 "help needed" locations

Assumptions:
- > 100 users in location
- no null/blank location
- most help needed calculated by subtracting the total answers given in a location from the number of questions asked
 (subjective, case could be made to average over individual user deltas?)
*/

WITH HelpData AS (
	SELECT u.Id, u.[Location], COUNT(CASE WHEN p.PostTypeId = 1 THEN 1 END) AS QuestionCount,
		COUNT(CASE WHEN p.PostTypeId = 2 THEN 1 END) AS AnswerCount
	FROM dbo.Users u INNER JOIN dbo.Posts p ON u.Id = p.OwnerUserId
	WHERE u.[Location] IS NOT NULL
		AND u.[Location] <> ''
	GROUP BY u.Id, u.[Location]
)

SELECT TOP 10 [Location], COUNT(*) AS [Population], (SUM(QuestionCount) - SUM(AnswerCount)) AS AnswerDelta
FROM HelpData
GROUP BY [Location]
HAVING COUNT(*) >= 100
ORDER BY AnswerDelta DESC
	/*
	Top 10 "helpful" locations

	Assumptions:
	- > 100 users in location
	- no null/blank location
	- most helpful calculated by highest overall average answer score (subjective)
	*/

	WITH AnswerData AS (
	SELECT u.Id, u.[Location], AVG(p.Score) AS 'AvgAnswerScore'
	FROM dbo.Users u INNER JOIN dbo.Posts p ON u.Id = p.OwnerUserId
	WHERE p.PostTypeID = 2
	AND u.[Location] IS NOT NULL
	AND u.[Location] <> ''
	GROUP BY u.Id, u.[Location]
	)

	SELECT TOP 10 [Location], COUNT(*) AS [Population], AVG(AvgAnswerScore) AS AvgAnswerRep
	FROM AnswerData
	GROUP BY [Location]
	HAVING COUNT(*) >= 100
	ORDER BY AvgAnswerRep DESC


	/*
	Top 10 "help needed" locations

	Assumptions:
	- > 100 users in location
	- no null/blank location
	- most help needed calculated by subtracting the total answers given in a location from the number of questions asked
	(subjective, case could be made to average over individual user deltas?)
	*/

	WITH HelpData AS (
	SELECT u.Id, u.[Location], COUNT(CASE WHEN p.PostTypeId = 1 THEN 1 END) AS QuestionCount,
	COUNT(CASE WHEN p.PostTypeId = 2 THEN 1 END) AS AnswerCount
	FROM dbo.Users u INNER JOIN dbo.Posts p ON u.Id = p.OwnerUserId
	WHERE u.[Location] IS NOT NULL
	AND u.[Location] <> ''
	GROUP BY u.Id, u.[Location]
	)

	SELECT TOP 10 [Location], COUNT(*) AS [Population], (SUM(QuestionCount) - SUM(AnswerCount)) AS AnswerDelta
	FROM HelpData
	GROUP BY [Location]
	HAVING COUNT(*) >= 100
	ORDER BY AnswerDelta DESC