jepma/parquet-pandas.py

## parquet-pandas.py
import numpy as np
import pandas as pd
import pyarrow as pa
import pyarrow.parquet as pq

# read parquet-file
table = pq.read_table("FILENAME_HERE")
table_pd = table.to_pandas()

# retrieving columns
parquet_columns = table.schema
for parquet_column in parquet_columns:
  print(parquet_column)

# iterate over rows:
for index, row in table_pd.iterrows():
  print(row)
	import numpy as np
	import pandas as pd
	import pyarrow as pa
	import pyarrow.parquet as pq

	# read parquet-file
	table = pq.read_table("FILENAME_HERE")
	table_pd = table.to_pandas()

	# retrieving columns
	parquet_columns = table.schema
	for parquet_column in parquet_columns:
	print(parquet_column)

	# iterate over rows:
	for index, row in table_pd.iterrows():
	print(row)