jordansamuels/repro.py

## repro.py
import pandas as pd
import pyarrow
import pyarrow.csv as pcsv
import os

pd.DataFrame({'x': [1]}).to_csv('/tmp/1.csv.gz', index=False, compression='gzip')
pd.DataFrame({'x': [2]}).to_csv('/tmp/2.csv.gz', header=False, index=False, compression='gzip')
os.system("cat /tmp/1.csv.gz /tmp/2.csv.gz > /tmp/t.csv.gz")

print("pyarrow.csv only reads one row:")
print(pcsv.read_csv('/tmp/t.csv.gz').to_pandas())
print("pandas reads two rows:")
print(pd.read_csv('/tmp/t.csv.gz'))
print("pyarrow version: " + pyarrow.__version__)
	import pandas as pd
	import pyarrow
	import pyarrow.csv as pcsv
	import os

	pd.DataFrame({'x': [1]}).to_csv('/tmp/1.csv.gz', index=False, compression='gzip')
	pd.DataFrame({'x': [2]}).to_csv('/tmp/2.csv.gz', header=False, index=False, compression='gzip')
	os.system("cat /tmp/1.csv.gz /tmp/2.csv.gz > /tmp/t.csv.gz")

	print("pyarrow.csv only reads one row:")
	print(pcsv.read_csv('/tmp/t.csv.gz').to_pandas())
	print("pandas reads two rows:")
	print(pd.read_csv('/tmp/t.csv.gz'))
	print("pyarrow version: " + pyarrow.__version__)