reata/count_distinct_vs_group_by.sql

## count_distinct_vs_group_by.sql
/*
 SELECT DISTINCT
 */
WITH foo (pk1, pk2) AS
         (SELECT 1, 'a'
          UNION ALL
          SELECT 1, 'b'
          UNION ALL
          SELECT 2, 'a'
          UNION ALL
          SELECT 2, NULL)
SELECT DISTINCT pk1, pk2
FROM foo;
-- 1,a
-- 1,b
-- 2,a
-- 2,<null>


/*
 GROUP BY
 */
WITH foo (pk1, pk2) AS
         (SELECT 1, 'a'
          UNION ALL
          SELECT 1, 'b'
          UNION ALL
          SELECT 2, 'a'
          UNION ALL
          SELECT 2, NULL)
SELECT pk1, pk2
FROM foo
GROUP BY 1, 2;
-- 1,a
-- 1,b
-- 2,a
-- 2,<null>


/*
 SELECT COUNT(DISTINCT), the NULL row won't count
 */
WITH foo (pk1, pk2) AS
         (SELECT 1, 'a'
          UNION ALL
          SELECT 1, 'b'
          UNION ALL
          SELECT 2, 'a'
          UNION ALL
          SELECT 2, NULL)
SELECT count(*), count(DISTINCT pk1, pk2), count(DISTINCT pk2)
FROM foo;
-- 4,3,2


/*
 SELECT COUNT(*) FROM subquery with GROUP BY,
 */
WITH foo (pk1, pk2) AS
         (SELECT 1, 'a'
          UNION ALL
          SELECT 1, 'b'
          UNION ALL
          SELECT 2, 'a'
          UNION ALL
          SELECT 2, NULL)
SELECT count(*)
FROM (SELECT pk1, pk2
      FROM foo
      GROUP BY 1, 2) as p;
-- 4
	/*
	SELECT DISTINCT
	*/
	WITH foo (pk1, pk2) AS
	(SELECT 1, 'a'
	UNION ALL
	SELECT 1, 'b'
	UNION ALL
	SELECT 2, 'a'
	UNION ALL
	SELECT 2, NULL)
	SELECT DISTINCT pk1, pk2
	FROM foo;
	-- 1,a
	-- 1,b
	-- 2,a
	-- 2,<null>


	/*
	GROUP BY
	*/
	WITH foo (pk1, pk2) AS
	(SELECT 1, 'a'
	UNION ALL
	SELECT 1, 'b'
	UNION ALL
	SELECT 2, 'a'
	UNION ALL
	SELECT 2, NULL)
	SELECT pk1, pk2
	FROM foo
	GROUP BY 1, 2;
	-- 1,a
	-- 1,b
	-- 2,a
	-- 2,<null>


	/*
	SELECT COUNT(DISTINCT), the NULL row won't count
	*/
	WITH foo (pk1, pk2) AS
	(SELECT 1, 'a'
	UNION ALL
	SELECT 1, 'b'
	UNION ALL
	SELECT 2, 'a'
	UNION ALL
	SELECT 2, NULL)
	SELECT count(*), count(DISTINCT pk1, pk2), count(DISTINCT pk2)
	FROM foo;
	-- 4,3,2


	/*
	SELECT COUNT(*) FROM subquery with GROUP BY,
	*/
	WITH foo (pk1, pk2) AS
	(SELECT 1, 'a'
	UNION ALL
	SELECT 1, 'b'
	UNION ALL
	SELECT 2, 'a'
	UNION ALL
	SELECT 2, NULL)
	SELECT count(*)
	FROM (SELECT pk1, pk2
	FROM foo
	GROUP BY 1, 2) as p;
	-- 4