ianmcook/write_parquet_float.cpp

## write_parquet_float.cpp
#include <iostream>
#include <random>
#include <arrow/api.h>
#include <arrow/io/api.h>
#include <parquet/arrow/writer.h>


float GetRandomFloat()
{
    static std::default_random_engine e;
    static std::uniform_real_distribution<> dis(0, 1);
    return dis(e);
}

arrow::Status WriteTableToParquetFile() {

  std::shared_ptr<arrow::Array> array;
  arrow::FloatBuilder builder;
  for (int i = 0; i < 10; i++) {
    ARROW_RETURN_NOT_OK(builder.Append(GetRandomFloat()));
  }
  ARROW_RETURN_NOT_OK(builder.Finish(&array));

  std::vector<std::shared_ptr<arrow::Array>> arrays;
  arrays.push_back(array);

  std::vector<std::shared_ptr<arrow::Field>> schema_vector;
  schema_vector.push_back(arrow::field("f", arrow::float32()));

  auto schema = std::make_shared<arrow::Schema>(schema_vector);

  std::shared_ptr<arrow::Table> table = arrow::Table::Make(schema, arrays);

  std::shared_ptr<parquet::WriterProperties> props =
      parquet::WriterProperties::Builder()
      .compression(arrow::Compression::SNAPPY)
      ->disable_dictionary()
      ->encoding(parquet::Encoding::BYTE_STREAM_SPLIT)
      ->build();

  std::shared_ptr<arrow::io::FileOutputStream> outfile;
  ARROW_ASSIGN_OR_RAISE(outfile, arrow::io::FileOutputStream::Open("test.parquet"));

  ARROW_RETURN_NOT_OK(parquet::arrow::WriteTable(*table.get(),
    arrow::default_memory_pool(), outfile, /*chunk_size=*/10, props));

  return arrow::Status::OK();
}

int main(int, char**) {
  auto status = WriteTableToParquetFile();
  if (!status.ok()) {
    std::cerr << "Error occurred : " << status.message() << std::endl;
    return EXIT_FAILURE;
  }
  return EXIT_SUCCESS;
}
	#include <iostream>
	#include <random>
	#include <arrow/api.h>
	#include <arrow/io/api.h>
	#include <parquet/arrow/writer.h>


	float GetRandomFloat()
	{
	static std::default_random_engine e;
	static std::uniform_real_distribution<> dis(0, 1);
	return dis(e);
	}

	arrow::Status WriteTableToParquetFile() {

	std::shared_ptr<arrow::Array> array;
	arrow::FloatBuilder builder;
	for (int i = 0; i < 10; i++) {
	ARROW_RETURN_NOT_OK(builder.Append(GetRandomFloat()));
	}
	ARROW_RETURN_NOT_OK(builder.Finish(&array));

	std::vector<std::shared_ptr<arrow::Array>> arrays;
	arrays.push_back(array);

	std::vector<std::shared_ptr<arrow::Field>> schema_vector;
	schema_vector.push_back(arrow::field("f", arrow::float32()));

	auto schema = std::make_shared<arrow::Schema>(schema_vector);

	std::shared_ptr<arrow::Table> table = arrow::Table::Make(schema, arrays);

	std::shared_ptr<parquet::WriterProperties> props =
	parquet::WriterProperties::Builder()
	.compression(arrow::Compression::SNAPPY)
	->disable_dictionary()
	->encoding(parquet::Encoding::BYTE_STREAM_SPLIT)
	->build();

	std::shared_ptr<arrow::io::FileOutputStream> outfile;
	ARROW_ASSIGN_OR_RAISE(outfile, arrow::io::FileOutputStream::Open("test.parquet"));

	ARROW_RETURN_NOT_OK(parquet::arrow::WriteTable(*table.get(),
	arrow::default_memory_pool(), outfile, /chunk_size=/10, props));

	return arrow::Status::OK();
	}

	int main(int, char**) {
	auto status = WriteTableToParquetFile();
	if (!status.ok()) {
	std::cerr << "Error occurred : " << status.message() << std::endl;
	return EXIT_FAILURE;
	}
	return EXIT_SUCCESS;
	}