AndreasMadsen/compile.log Secret

## compile.log
rm -f *.o
rm -f *.so
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.so.5 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.so.8.0 locally
g++ -std=c++11 -isystem /zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include -D_GLIBCXX_USE_CXX11_ABI=0 -fPIC -O2 -Wall -D GOOGLE_CUDA=1 -c -o l2loss_op.o l2loss_op.cc
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcurand.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcuda.so.1 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcufft.so.8.0 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcudnn.so.5 locally
I tensorflow/stream_executor/dso_loader.cc:128] successfully opened CUDA library libcublas.so.8.0 locally
nvcc -std=c++11 -isystem /zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include -D_GLIBCXX_USE_CXX11_ABI=0 -x cu -Xcompiler -fPIC -Xcompiler -Wall -D GOOGLE_CUDA=1 -c -o l2loss_op.cu.o l2loss_op.cu.cc
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorFunctors.h(116): error: no instance of function template "Eigen::internal::pset1" matches the argument list
            argument types are: (Eigen::half)
          detected during:
            instantiation of "Packet Eigen::internal::SumReducer<T>::initializePacket<Packet>() const [with T=Eigen::half, Packet=half2]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(198): here
            instantiation of "void Eigen::internal::ReductionInitFullReduxKernelHalfFloat(R, S, I, half2 *) [with S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(326): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(247): error: identifier "__shfl_down" is undefined
          detected during:
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorEvaluator.h(335): error: no suitable user-defined conversion from "const Eigen::half" to "half2" exists
          detected during:
            instantiation of "Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::PacketReturnType Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::packet<LoadMode>(Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::Index) const [with UnaryOp=Eigen::internal::scalar_square_op<const Eigen::half>, ArgType=const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>, Device=Eigen::GpuDevice, LoadMode=0]"
(335): here
            instantiation of "Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::PacketReturnType Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::packet<LoadMode>(Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::Index) const [with UnaryOp=Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>, Device=Eigen::GpuDevice, LoadMode=0]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(241): here
            instantiation of "void Eigen::internal::FullReductionKernelHalfFloat<B,N,S,R,I>(R, S, I, Eigen::half *, half2 *) [with B=256, N=128, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(330): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/Eigen/src/Core/functors/BinaryFunctors.h(471): error: no instance of function template "Eigen::internal::pset1" matches the argument list
            argument types are: (const Eigen::half)
          detected during:
            instantiation of "const Packet Eigen::internal::bind2nd_op<BinaryOp>::packetOp(const Packet &) const [with BinaryOp=Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>, Packet=half2]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorEvaluator.h(335): here
            instantiation of "Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::PacketReturnType Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::packet<LoadMode>(Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::Index) const [with UnaryOp=Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>, Device=Eigen::GpuDevice, LoadMode=0]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(241): here
            instantiation of "void Eigen::internal::FullReductionKernelHalfFloat<B,N,S,R,I>(R, S, I, Eigen::half *, half2 *) [with B=256, N=128, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(330): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/Eigen/src/Core/functors/BinaryFunctors.h(471): error: no instance of function template "Eigen::internal::scalar_product_op<LhsScalar, RhsScalar>::packetOp [with LhsScalar=Eigen::half, RhsScalar=Eigen::half]" matches the argument list
            argument types are: (const half2, <error-type>)
          detected during:
            instantiation of "const Packet Eigen::internal::bind2nd_op<BinaryOp>::packetOp(const Packet &) const [with BinaryOp=Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>, Packet=half2]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorEvaluator.h(335): here
            instantiation of "Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::PacketReturnType Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::packet<LoadMode>(Eigen::TensorEvaluator<const Eigen::TensorCwiseUnaryOp<UnaryOp, ArgType>, Device>::Index) const [with UnaryOp=Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>, Device=Eigen::GpuDevice, LoadMode=0]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(241): here
            instantiation of "void Eigen::internal::FullReductionKernelHalfFloat<B,N,S,R,I>(R, S, I, Eigen::half *, half2 *) [with B=256, N=128, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(330): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/Eigen/src/Core/GenericPacketMath.h(152): error: no operator "+" matches these operands
            operand types are: const half2 + const half2
          detected during:
            instantiation of "Packet Eigen::internal::padd(const Packet &, const Packet &) [with Packet=half2]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorFunctors.h(107): here
            instantiation of "void Eigen::internal::SumReducer<T>::reducePacket(const Packet &, Packet *) const [with T=Eigen::half, Packet=half2]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(242): here
            instantiation of "void Eigen::internal::FullReductionKernelHalfFloat<B,N,S,R,I>(R, S, I, Eigen::half *, half2 *) [with B=256, N=128, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(330): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(247): error: no instance of function template "Eigen::internal::SumReducer<T>::reducePacket [with T=Eigen::half]" matches the argument list
            argument types are: (<error-type>, half2 *)
            object type is: Eigen::internal::SumReducer<Eigen::half>
          detected during:
            instantiation of "void Eigen::internal::FullReductionKernelHalfFloat<B,N,S,R,I>(R, S, I, Eigen::half *, half2 *) [with B=256, N=128, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
(330): here
            instantiation of "void Eigen::internal::FullReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
(367): here
            instantiation of "void Eigen::internal::FullReducer<Self, Op, Eigen::GpuDevice, Vectorizable>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, Vectorizable=false, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(490): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(519): error: identifier "__shfl_down" is undefined
          detected during:
            instantiation of "__nv_bool Eigen::internal::InnerReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
(661): here
            instantiation of "__nv_bool Eigen::internal::InnerReducer<Self, Op, Eigen::GpuDevice>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(518): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(519): error: no instance of function template "Eigen::internal::SumReducer<T>::reducePacket [with T=Eigen::half]" matches the argument list
            argument types are: (<error-type>, half2 *)
            object type is: Eigen::internal::SumReducer<Eigen::half>
          detected during:
            instantiation of "void Eigen::internal::InnerReductionKernelHalfFloat<NPT,S,R,I>(R, S, I, I, Eigen::half *) [with NPT=64, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
(623): here
            instantiation of "__nv_bool Eigen::internal::InnerReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
(661): here
            instantiation of "__nv_bool Eigen::internal::InnerReducer<Self, Op, Eigen::GpuDevice>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(518): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReductionCuda.h(520): error: no instance of function template "Eigen::internal::SumReducer<T>::reducePacket [with T=Eigen::half]" matches the argument list
            argument types are: (<error-type>, half2 *)
            object type is: Eigen::internal::SumReducer<Eigen::half>
          detected during:
            instantiation of "void Eigen::internal::InnerReductionKernelHalfFloat<NPT,S,R,I>(R, S, I, I, Eigen::half *) [with NPT=64, S=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, R=Eigen::internal::SumReducer<Eigen::half>, I=Eigen::DenseIndex]"
(623): here
            instantiation of "__nv_bool Eigen::internal::InnerReductionLauncher<Self, Op, Eigen::half, true, void>::run(const Self &, Op &, const Eigen::GpuDevice &, Eigen::half *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>]"
(661): here
            instantiation of "__nv_bool Eigen::internal::InnerReducer<Self, Op, Eigen::GpuDevice>::run(const Self &, Op &, const Eigen::GpuDevice &, OutputType *, Self::Index, Self::Index) [with Self=Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Eigen::GpuDevice>, Op=Eigen::internal::SumReducer<Eigen::half>, OutputType=Eigen::half]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorReduction.h(518): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorReductionOp<Op, Dims, ArgType>, Device>::CoeffReturnType *) [with Op=Eigen::internal::SumReducer<Eigen::half>, Dims=const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, ArgType=const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorAssign.h(128): here
            instantiation of "__nv_bool Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::evalSubExprsIfNeeded(Eigen::TensorEvaluator<const Eigen::TensorAssignOp<LeftArgType, RightArgType>, Device>::Scalar *) [with LeftArgType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, RightArgType=const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>, Device=Eigen::GpuDevice]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorExecutor.h(251): here
            instantiation of "void Eigen::internal::TensorExecutor<Expression, Eigen::GpuDevice, Vectorizable>::run(const Expression &, const Eigen::GpuDevice &) [with Expression=const Eigen::TensorAssignOp<Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, const Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>>, Vectorizable=false]"
/zhome/ff/2/77654/stdpy3/lib/python3.5/site-packages/tensorflow/include/unsupported/Eigen/CXX11/src/Tensor/TensorDevice.h(35): here
            instantiation of "Eigen::TensorDevice<ExpressionType, DeviceType> &Eigen::TensorDevice<ExpressionType, DeviceType>::operator=(const OtherDerived &) [with ExpressionType=Eigen::TensorMap<Eigen::TensorFixedSize<Eigen::half, Eigen::Sizes<>, 1, Eigen::DenseIndex, Eigen::MakePointer>, 16, Eigen::MakePointer>, DeviceType=tensorflow::GPUDevice, OtherDerived=Eigen::TensorReductionOp<Eigen::internal::SumReducer<Eigen::half>, const Eigen::DimensionList<Eigen::DenseIndex, 1UL>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::bind2nd_op<Eigen::internal::scalar_product_op<Eigen::half, Eigen::half>>, const Eigen::TensorCwiseUnaryOp<Eigen::internal::scalar_square_op<const Eigen::half>, const Eigen::TensorMap<Eigen::Tensor<const Eigen::half, 1, 1, Eigen::DenseIndex>, 16, Eigen::MakePointer>>>>]"
l2loss_op.h(32): here
            instantiation of "void tensorflow::functor::CustomL2Loss<Device, T>::operator()(const Device &, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::ConstTensor, tensorflow::TTypes<T, 1, Eigen::DenseIndex>::Scalar) [with Device=tensorflow::GPUDevice, T=Eigen::half]"
l2loss_op.cu.cc(29): here

10 errors detected in the compilation of "/tmp/tmpxft_00004ee7_00000000-7_l2loss_op.cu.cpp1.ii".
make: *** [l2loss_op.cu.o] Error 2