RobinL/example.py Secret

## example.py
import duckdb
import pandas as pd


data = {
    'arr_1': [["robin","dave","james"]],
    'arr_2': [["robyn","steve"]]
}
df = pd.DataFrame(data)


query = """
SELECT

    flatten(list_transform(arr_1,
        x -> (list_transform(arr_2, y -> [x,y]))
    )) as all_pairs
FROM df
"""

df_c = duckdb.sql(query).df()
print(df_c.iloc[0,0])


query = """
SELECT
    list_transform(all_pairs,
        x -> levenshtein(x[1], x[2]) < 2
    ) as scores
FROM df_c
"""

df_scored = duckdb.sql(query).df()
print(duckdb.sql(query).df().iloc[0,0])

query = """
SELECT
    list_reduce(scores, (x,y) -> x or y)
FROM df_scored
"""

print(duckdb.sql(query).df().iloc[0,0])

## reusult.txt
[['robin', 'robyn'], ['robin', 'steve'], ['dave', 'robyn'], ['dave', 'steve'], ['james', 'robyn'], ['james', 'steve']]
[True, False, False, False, False, False]
True
	import duckdb
	import pandas as pd


	data = {
	'arr_1': [["robin","dave","james"]],
	'arr_2': [["robyn","steve"]]
	}
	df = pd.DataFrame(data)




	query = """
	SELECT

	flatten(list_transform(arr_1,
	x -> (list_transform(arr_2, y -> [x,y]))
	)) as all_pairs
	FROM df
	"""

	df_c = duckdb.sql(query).df()
	print(df_c.iloc[0,0])



	query = """
	SELECT
	list_transform(all_pairs,
	x -> levenshtein(x[1], x[2]) < 2
	) as scores
	FROM df_c
	"""

	df_scored = duckdb.sql(query).df()
	print(duckdb.sql(query).df().iloc[0,0])

	query = """
	SELECT
	list_reduce(scores, (x,y) -> x or y)
	FROM df_scored
	"""

	print(duckdb.sql(query).df().iloc[0,0])
	[['robin', 'robyn'], ['robin', 'steve'], ['dave', 'robyn'], ['dave', 'steve'], ['james', 'robyn'], ['james', 'steve']]
	[True, False, False, False, False, False]
	True