kice/awarp.cpp

## awarp.cpp
// SMAGL is 0 or 2
// PixelType is uint8_t
static void warp_c(const uint8_t *srcp8, const uint8_t *edgep8, uint8_t *dstp8, int src_stride, int edge_stride, int dst_stride, int width, int height, int depth, int bits_per_sample)
{
    const uint8_t *srcp = (const uint8_t *)srcp8;
    const uint8_t *edgep = (const uint8_t *)edgep8;
    uint8_t *dstp = (uint8_t *)dstp8;

    src_stride /= sizeof(uint8_t);
    edge_stride /= sizeof(uint8_t);
    dst_stride /= sizeof(uint8_t);

    int pixel_max = (1 << bits_per_sample) - 1;

    const int x_limit_min = 0;
    const int x_limit_max = (width - 1);

    float scale = (depth << 8) / 65536.0f;

    for (int y = 0; y < height; y++) {
        float y_limit_min = -y;
        float y_limit_max = (height - y - 1) - 1e-2f;

        for (int x = 0; x < width; x++) {
            // calculate displacement

            int above, below;
            if (y == 0)
                above = edgep[x];
            else
                above = edgep[-edge_stride + x];

            if (y == height - 1)
                below = edgep[x];
            else
                below = edgep[edge_stride + x];

            int left, right;
            if (x == 0)
                left = edgep[x];
            else
                left = edgep[x - 1];

            if (x == width - 1)
                right = edgep[x];
            else
                right = edgep[x + 1];

            float _h = (left - right) * scale;
            float _v = (above - below) * scale;

            _v = std::clamp(_v, y_limit_min, y_limit_max);

            float remainder_h = fmod(_h, 1.0);
            remainder_h = remainder_h < 0.0 ? 1.0 + remainder_h : remainder_h;

            float remainder_v = fmod(_v, 1.0);
            remainder_v = remainder_v < 0.0 ? 1.0 + remainder_v : remainder_v;

            int h = floor(_h) + x, v = floor(_v);

            remainder_h = (x_limit_max > h) && !(x_limit_min > h) ? remainder_h : 0;

            h = std::min(h, x_limit_max);
            h = std::max(h, x_limit_min);

            // h and v contain the displacement now.

            int s00 = srcp[v * src_stride + h];
            int s01 = srcp[v * src_stride + h + 1];
            int s10 = srcp[(v + 1) * src_stride + h];
            int s11 = srcp[(v + 1) * src_stride + h + 1];

            float s0 = s00 * (1.0 - remainder_h) + s01 * remainder_h + 0.5;
            float s1 = s10 * (1.0 - remainder_h) + s11 * remainder_h + 0.5;
            float s  =  s0 * (1.0 - remainder_v) +  s1 * remainder_v + 0.5;

            int val = nearbyint(s); // Use floor to match original
            dstp[x] = std::min(std::max(val, 0), pixel_max);
        }

        srcp += src_stride;
        edgep += edge_stride;
        dstp += dst_stride;
    }
}
	// SMAGL is 0 or 2
	// PixelType is uint8_t
	static void warp_c(const uint8_t srcp8, const uint8_t edgep8, uint8_t *dstp8, int src_stride, int edge_stride, int dst_stride, int width, int height, int depth, int bits_per_sample)
	{
	const uint8_t srcp = (const uint8_t )srcp8;
	const uint8_t edgep = (const uint8_t )edgep8;
	uint8_t dstp = (uint8_t )dstp8;

	src_stride /= sizeof(uint8_t);
	edge_stride /= sizeof(uint8_t);
	dst_stride /= sizeof(uint8_t);

	int pixel_max = (1 << bits_per_sample) - 1;

	const int x_limit_min = 0;
	const int x_limit_max = (width - 1);

	float scale = (depth << 8) / 65536.0f;

	for (int y = 0; y < height; y++) {
	float y_limit_min = -y;
	float y_limit_max = (height - y - 1) - 1e-2f;

	for (int x = 0; x < width; x++) {
	// calculate displacement

	int above, below;
	if (y == 0)
	above = edgep[x];
	else
	above = edgep[-edge_stride + x];

	if (y == height - 1)
	below = edgep[x];
	else
	below = edgep[edge_stride + x];

	int left, right;
	if (x == 0)
	left = edgep[x];
	else
	left = edgep[x - 1];

	if (x == width - 1)
	right = edgep[x];
	else
	right = edgep[x + 1];

	float _h = (left - right) * scale;
	float _v = (above - below) * scale;

	_v = std::clamp(_v, y_limit_min, y_limit_max);

	float remainder_h = fmod(_h, 1.0);
	remainder_h = remainder_h < 0.0 ? 1.0 + remainder_h : remainder_h;

	float remainder_v = fmod(_v, 1.0);
	remainder_v = remainder_v < 0.0 ? 1.0 + remainder_v : remainder_v;

	int h = floor(_h) + x, v = floor(_v);

	remainder_h = (x_limit_max > h) && !(x_limit_min > h) ? remainder_h : 0;

	h = std::min(h, x_limit_max);
	h = std::max(h, x_limit_min);

	// h and v contain the displacement now.

	int s00 = srcp[v * src_stride + h];
	int s01 = srcp[v * src_stride + h + 1];
	int s10 = srcp[(v + 1) * src_stride + h];
	int s11 = srcp[(v + 1) * src_stride + h + 1];

	float s0 = s00 * (1.0 - remainder_h) + s01 * remainder_h + 0.5;
	float s1 = s10 * (1.0 - remainder_h) + s11 * remainder_h + 0.5;
	float s = s0 * (1.0 - remainder_v) + s1 * remainder_v + 0.5;

	int val = nearbyint(s); // Use floor to match original
	dstp[x] = std::min(std::max(val, 0), pixel_max);
	}

	srcp += src_stride;
	edgep += edge_stride;
	dstp += dst_stride;
	}
	}