青子守歌 aokomoriuta

## test.cpp
#include <utility>

#include <boost/fusion/include/transform.hpp>
#include <boost/fusion/include/make_vector.hpp>
#include <boost/fusion/include/invoke.hpp>

class S
{
private:
	int a;

## apu.txt
===================================================
GPU Caps Viewer v1.20.1.1
http://www.ozone3d.net/gpu_caps_viewer/
===================================================


===================================[ System / CPU ]
- CPU Name: AMD A10-7850K Radeon R7, 12 Compute Cores 4C+8G
- CPU Core Speed: 3718 MHz
- CPU logical cores: 4

## table.csv
#Dir,mx,my,mz,deltaT,endTime,method,nx,ny,nz,simulationType,LESModel,delta,solver,preconditioner,Build,Date,Time,nProcs,nCells,Steps,ExectutionTime0(s),ExectutionTime1(s),ExectutionTime/Steps(s)
n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,dev-f6be0d888eec,May 21 2015,08:48:50,1,2995200,0,0,0,-0
n_00008/mp

## log.pimpleFoam.677
/*---------------------------------------------------------------------------*\
| =========                 |                                                 |
| \\      /  F ield         | OpenFOAM: The Open Source CFD Toolbox           |
|  \\    /   O peration     | Version:  dev                                   |
|   \\  /    A nd           | Web:      www.OpenFOAM.org                      |
|    \\/     M anipulation  |                                                 |
\*---------------------------------------------------------------------------*/
Build  : dev-f6be0d888eec
Exec   : pimpleFoam
Date   : May 21 2015

## build.log
make: Nothing to be done for 'all'.

========================================
Start ThirdParty Allwmake
========================================

========================================
Build MPI libraries if required

    have OPENMPI shared library (openmpi-1.8.4)

## svm.cpp
#define _SCL_SECURE_NO_WARNINGS
#define __CL_ENABLE_EXCEPTIONS

#ifdef _MSC_VER
#pragma warning(push, 1)
#pragma warning(disable: 4996)
#endif
#include <iostream>
#include <CL/cl.hpp>
#ifdef _MSC_VER

## 倍精度.txt
https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/HeavyWorkItem の倍精度での結果。
単精度と同じでした（処理量変えても早くならない）。

= ベクトル加算の試験 =
1ワークアイテムの処理量を変えてみる

プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
デバイス数：2
* GeForce GTX 295 (NVIDIA Corporation)
* GeForce GTX 295 (NVIDIA Corporation)

## 倍精度.txt
https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/MultiGpu の倍精度版。

倍精度にすると更に速い（単一CPUに比べてx6）。
あれ？倍精度演算のほうが計算速度遅いんじゃないの、と思ったが、たぶんメモリ律速のせい。

= ベクトル加算の試験 =
複数GPUを使う

プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
デバイス数：2

## 倍精度.txt
https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/UseHostPointer の倍精度の結果

単精度と傾向は同じ。
ただしやはり加速率は倍精度のほうが上。

= ベクトル加算の試験 =
ホストポインタの使用有無での比較

プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
デバイス数：2

## Length2.cpp
#include<iostream>

// 2次元ベクトルCPU
void Length2()
{
    // 要素数
    const int N = 5;

    // x, y方向成分
    double x[N] = {0, 1, 2, 3, 4};
	#include <utility>

	#include <boost/fusion/include/transform.hpp>
	#include <boost/fusion/include/make_vector.hpp>
	#include <boost/fusion/include/invoke.hpp>

	class S
	{
	private:
	int a;
	===================================================
	GPU Caps Viewer v1.20.1.1
	http://www.ozone3d.net/gpu_caps_viewer/
	===================================================


	===================================[ System / CPU ]
	- CPU Name: AMD A10-7850K Radeon R7, 12 Compute Cores 4C+8G
	- CPU Core Speed: 3718 MHz
	- CPU logical cores: 4
	#Dir,mx,my,mz,deltaT,endTime,method,nx,ny,nz,simulationType,LESModel,delta,solver,preconditioner,Build,Date,Time,nProcs,nCells,Steps,ExectutionTime0(s),ExectutionTime1(s),ExectutionTime/Steps(s)
	n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
	n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
	n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,,,,,,0,0,0,-0
	n_00008/mpi_00001/simulationType_laminar-LESModel_laminar-delta_cubeRootVol-solver_GAMG-smoother_DIC,240,130,96,0.002000,0.022000,scotch,-,-,-,laminar,laminar,cubeRootVol,GAMG,DIC,dev-f6be0d888eec,May 21 2015,08:48:50,1,2995200,0,0,0,-0
	n_00008/mp
	/---------------------------------------------------------------------------\
	\| ========= \| \|
	\| \\ / F ield \| OpenFOAM: The Open Source CFD Toolbox \|
	\| \\ / O peration \| Version: dev \|
	\| \\ / A nd \| Web: www.OpenFOAM.org \|
	\| \\/ M anipulation \| \|
	\---------------------------------------------------------------------------/
	Build : dev-f6be0d888eec
	Exec : pimpleFoam
	Date : May 21 2015
	make: Nothing to be done for 'all'.

	========================================
	Start ThirdParty Allwmake
	========================================

	========================================
	Build MPI libraries if required

	have OPENMPI shared library (openmpi-1.8.4)
	#define _SCL_SECURE_NO_WARNINGS
	#define __CL_ENABLE_EXCEPTIONS

	#ifdef _MSC_VER
	#pragma warning(push, 1)
	#pragma warning(disable: 4996)
	#endif
	#include <iostream>
	#include <CL/cl.hpp>
	#ifdef _MSC_VER
	https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/HeavyWorkItem の倍精度での結果。
	単精度と同じでした（処理量変えても早くならない）。

	= ベクトル加算の試験 =
	1ワークアイテムの処理量を変えてみる

	プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
	デバイス数：2
	* GeForce GTX 295 (NVIDIA Corporation)
	* GeForce GTX 295 (NVIDIA Corporation)
	https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/MultiGpu の倍精度版。

	倍精度にすると更に速い（単一CPUに比べてx6）。
	あれ？倍精度演算のほうが計算速度遅いんじゃないの、と思ったが、たぶんメモリ律速のせい。

	= ベクトル加算の試験 =
	複数GPUを使う

	プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
	デバイス数：2
	https://github.com/aokomoriuta/StudiesOfOpenCLWithCloo/tree/master/VectorAddition/UseHostPointer の倍精度の結果

	単精度と傾向は同じ。
	ただしやはり加速率は倍精度のほうが上。

	= ベクトル加算の試験 =
	ホストポインタの使用有無での比較

	プラットフォーム：NVIDIA CUDA (OpenCL 1.1 CUDA 4.1.1)
	デバイス数：2
	#include<iostream>

	// 2次元ベクトルCPU
	void Length2()
	{
	// 要素数
	const int N = 5;

	// x, y方向成分
	double x[N] = {0, 1, 2, 3, 4};