willard-yuan/vlfeat_sift.cpp

## vlfeat_sift.cpp
// OpenCV can be used to read images.
#include <opencv2/opencv.hpp>
#include <opencv2/core/core.hpp>
#include <opencv2/highgui/highgui.hpp>
#include <string>
#include <iostream>

// The VLFeat header files need to be declared external.
extern "C"{
#include <vl/generic.h>
#include <vl/stringop.h>
#include <vl/pgm.h>
#include <vl/sift.h>
#include <vl/getopt_long.h>
#include <vl/covdet.h>
};

using namespace std;
using namespace cv;

int main()
{
    //VL_PRINT ("Hello world!\n") ;
    string ImagePath = "C:\\Users\\Administrator\\Desktop\\img1.jpg";
	Mat image = imread(ImagePath, CV_LOAD_IMAGE_GRAYSCALE);   // Read the file
	int im_width = image.cols;
	int im_height = image.rows;

	// Transferring image to vlfeat structure
	unsigned int number_pixels = im_width*im_height;
	vl_sift_pix* data = new vl_sift_pix[number_pixels*sizeof(vl_sift_pix)];
	for (unsigned int ind = 0; ind < number_pixels; ind++) {
		data[ind] = static_cast<vl_sift_pix>(image.data[ind]);  //逐行顺序存储
	}

	//cout << data[200000-500-1] << "\t" << data[200000-3] << "\t" << data[200000-2] << "\t" << data[200000-1] << endl;

	int verbose = 1;
	bool divide_512 = 0;
	vector<float*> frames;
	vector<float*> descr;

	// VLSIFT parameters
	int                O     = - 1 ;
	int                S     =   3 ;
	int                o_min =   0 ;
	double             edge_thresh = -1;
	double             peak_thresh = -1 ;
	double             norm_thresh = -1 ;
	double             magnif      = -1 ;
	double             window_size = -1 ;

	bool            force_orientations = false ;

	VlSiftFilt* filt = vl_sift_new(im_width, im_height, O, S, o_min);

	int                nframes = 0, i,j,q ;

	if (peak_thresh >= 0) vl_sift_set_peak_thresh (filt, peak_thresh) ;
	if (edge_thresh >= 0) vl_sift_set_edge_thresh (filt, edge_thresh) ;
	if (norm_thresh >= 0) vl_sift_set_norm_thresh (filt, norm_thresh) ;
	if (magnif      >= 0) vl_sift_set_magnif      (filt, magnif) ;
	if (window_size >= 0) vl_sift_set_window_size (filt, window_size) ;

	if (verbose) {
	  printf("vl_sift: filter settings:\n") ;
	  printf("vl_sift:   image width           = %d\n",
				im_width) ;
	  printf("vl_sift:   image height          = %d\n",
				im_height) ;
	  printf("vl_sift:   octaves      (O)      = %d\n",
				vl_sift_get_noctaves      (filt)) ;
	  printf("vl_sift:   levels       (S)      = %d\n",
				vl_sift_get_nlevels       (filt)) ;
	  printf("vl_sift:   first octave (o_min)  = %d\n",
				vl_sift_get_octave_first  (filt)) ;
	  printf("vl_sift:   edge thresh           = %g\n",
				vl_sift_get_edge_thresh   (filt)) ;
	  printf("vl_sift:   peak thresh           = %g\n",
				vl_sift_get_peak_thresh   (filt)) ;
	  printf("vl_sift:   norm thresh           = %g\n",
				vl_sift_get_norm_thresh   (filt)) ;
	  printf("vl_sift:   window size           = %g\n",
				vl_sift_get_window_size   (filt)) ;

	  printf("vl_sift: will force orientations? %s\n",
				force_orientations ? "yes" : "no") ;
	}

	/* ...............................................................
	 *                                             Process each octave
	 * ............................................................ */

	i     = 0 ;
	bool first = true;
	while (true) {
		int                   err ;
		VlSiftKeypoint const *keys  = 0 ;
		int                   nkeys = 0 ;

		if (verbose) {
			printf ("vl_sift: processing octave %d\n",
					   vl_sift_get_octave_index (filt)) ;
		}

		/* Calculate the GSS for the next octave .................... */
		if (first) {
			err   = vl_sift_process_first_octave (filt, data) ;
			first = false;
		} else {
			err   = vl_sift_process_next_octave  (filt) ;
		}

		if (err) break ;

		if (verbose > 1) {
			printf("vl_sift: GSS octave %d computed\n",
					  vl_sift_get_octave_index (filt));
		}

		/* Run detector ............................................. */

		vl_sift_detect (filt) ;

		keys  = vl_sift_get_keypoints  (filt) ;
		nkeys = vl_sift_get_nkeypoints (filt) ;
		i     = 0 ;

		if (verbose > 1) {
		  printf ("vl_sift: detected %d (unoriented) keypoints\n", nkeys) ;
		}


		/* For each keypoint ........................................ */
		for (; i < nkeys ; ++i) {
			double                angles [4] ;
			int                   nangles ;
			VlSiftKeypoint const *k ;

			/* Obtain keypoint orientations ........................... */
			k = keys + i ;
			nangles = vl_sift_calc_keypoint_orientations(filt, angles, k) ;

			/* For each orientation ................................... */
			for (q = 0 ; q < nangles ; ++q) {
				vl_sift_pix rbuf [128] ;
				float* this_frame = new float[4*sizeof(float)];
				float* this_descr = new float[128*sizeof(float)];

				/* compute descriptor */
				vl_sift_calc_keypoint_descriptor (filt, rbuf, k, angles [q]) ;

				this_frame [0] = k -> x ;
				this_frame [1] = k -> y ;
				this_frame [2] = k -> sigma ;
				this_frame [3] = angles [q];

				frames.push_back(this_frame);

				for (j = 0 ; j < 128 ; ++j) {
					float x;
					if (divide_512) {
						x = rbuf [j] ;
					} else {
						x = 512.0F * rbuf [j] ;
					}
					this_descr [j] = x ;
				}
				descr.push_back(this_descr);
				++ nframes ;
			} /* next orientation */
		} /* next keypoint */
	} /* next octave */


	int number_desc = nframes;
	cout << "sift detect points numbers: " << number_desc <<  endl;
	int tframeNum = 483;
	cout << "frame at "  << tframeNum << endl;
	for (int i = 0; i <  4; ++i)
		cout << frames[tframeNum][i] << "\t";
	cout << endl;
	cout << "descr at " << tframeNum << endl;
	for (int i = 0; i <  128; ++i)
		cout << descr[tframeNum][i] << "\t";
	cout << endl;

	// Clean up
	/* release filter */
	if (filt) {
		vl_sift_delete(filt);
		filt = 0;
	}
	/* release image data */
	if (data) {
	  delete[] data;
	  data = 0 ;
	}
	system("pause");
    return 0;
}
	// OpenCV can be used to read images.
	#include <opencv2/opencv.hpp>
	#include <opencv2/core/core.hpp>
	#include <opencv2/highgui/highgui.hpp>
	#include <string>
	#include <iostream>

	// The VLFeat header files need to be declared external.
	extern "C"{
	#include <vl/generic.h>
	#include <vl/stringop.h>
	#include <vl/pgm.h>
	#include <vl/sift.h>
	#include <vl/getopt_long.h>
	#include <vl/covdet.h>
	};

	using namespace std;
	using namespace cv;

	int main()
	{
	//VL_PRINT ("Hello world!\n") ;
	string ImagePath = "C:\\Users\\Administrator\\Desktop\\img1.jpg";
	Mat image = imread(ImagePath, CV_LOAD_IMAGE_GRAYSCALE); // Read the file
	int im_width = image.cols;
	int im_height = image.rows;

	// Transferring image to vlfeat structure
	unsigned int number_pixels = im_width*im_height;
	vl_sift_pix* data = new vl_sift_pix[number_pixels*sizeof(vl_sift_pix)];
	for (unsigned int ind = 0; ind < number_pixels; ind++) {
	data[ind] = static_cast<vl_sift_pix>(image.data[ind]); //逐行顺序存储
	}

	//cout << data[200000-500-1] << "\t" << data[200000-3] << "\t" << data[200000-2] << "\t" << data[200000-1] << endl;

	int verbose = 1;
	bool divide_512 = 0;
	vector<float*> frames;
	vector<float*> descr;

	// VLSIFT parameters
	int O = - 1 ;
	int S = 3 ;
	int o_min = 0 ;
	double edge_thresh = -1;
	double peak_thresh = -1 ;
	double norm_thresh = -1 ;
	double magnif = -1 ;
	double window_size = -1 ;

	bool force_orientations = false ;

	VlSiftFilt* filt = vl_sift_new(im_width, im_height, O, S, o_min);

	int nframes = 0, i,j,q ;

	if (peak_thresh >= 0) vl_sift_set_peak_thresh (filt, peak_thresh) ;
	if (edge_thresh >= 0) vl_sift_set_edge_thresh (filt, edge_thresh) ;
	if (norm_thresh >= 0) vl_sift_set_norm_thresh (filt, norm_thresh) ;
	if (magnif >= 0) vl_sift_set_magnif (filt, magnif) ;
	if (window_size >= 0) vl_sift_set_window_size (filt, window_size) ;

	if (verbose) {
	printf("vl_sift: filter settings:\n") ;
	printf("vl_sift: image width = %d\n",
	im_width) ;
	printf("vl_sift: image height = %d\n",
	im_height) ;
	printf("vl_sift: octaves (O) = %d\n",
	vl_sift_get_noctaves (filt)) ;
	printf("vl_sift: levels (S) = %d\n",
	vl_sift_get_nlevels (filt)) ;
	printf("vl_sift: first octave (o_min) = %d\n",
	vl_sift_get_octave_first (filt)) ;
	printf("vl_sift: edge thresh = %g\n",
	vl_sift_get_edge_thresh (filt)) ;
	printf("vl_sift: peak thresh = %g\n",
	vl_sift_get_peak_thresh (filt)) ;
	printf("vl_sift: norm thresh = %g\n",
	vl_sift_get_norm_thresh (filt)) ;
	printf("vl_sift: window size = %g\n",
	vl_sift_get_window_size (filt)) ;

	printf("vl_sift: will force orientations? %s\n",
	force_orientations ? "yes" : "no") ;
	}

	/* ...............................................................
	* Process each octave
	* ............................................................ */

	i = 0 ;
	bool first = true;
	while (true) {
	int err ;
	VlSiftKeypoint const *keys = 0 ;
	int nkeys = 0 ;

	if (verbose) {
	printf ("vl_sift: processing octave %d\n",
	vl_sift_get_octave_index (filt)) ;
	}

	/* Calculate the GSS for the next octave .................... */
	if (first) {
	err = vl_sift_process_first_octave (filt, data) ;
	first = false;
	} else {
	err = vl_sift_process_next_octave (filt) ;
	}

	if (err) break ;

	if (verbose > 1) {
	printf("vl_sift: GSS octave %d computed\n",
	vl_sift_get_octave_index (filt));
	}

	/* Run detector ............................................. */

	vl_sift_detect (filt) ;

	keys = vl_sift_get_keypoints (filt) ;
	nkeys = vl_sift_get_nkeypoints (filt) ;
	i = 0 ;

	if (verbose > 1) {
	printf ("vl_sift: detected %d (unoriented) keypoints\n", nkeys) ;
	}


	/* For each keypoint ........................................ */
	for (; i < nkeys ; ++i) {
	double angles [4] ;
	int nangles ;
	VlSiftKeypoint const *k ;

	/* Obtain keypoint orientations ........................... */
	k = keys + i ;
	nangles = vl_sift_calc_keypoint_orientations(filt, angles, k) ;

	/* For each orientation ................................... */
	for (q = 0 ; q < nangles ; ++q) {
	vl_sift_pix rbuf [128] ;
	float* this_frame = new float[4*sizeof(float)];
	float* this_descr = new float[128*sizeof(float)];

	/* compute descriptor */
	vl_sift_calc_keypoint_descriptor (filt, rbuf, k, angles [q]) ;

	this_frame [0] = k -> x ;
	this_frame [1] = k -> y ;
	this_frame [2] = k -> sigma ;
	this_frame [3] = angles [q];

	frames.push_back(this_frame);

	for (j = 0 ; j < 128 ; ++j) {
	float x;
	if (divide_512) {
	x = rbuf [j] ;
	} else {
	x = 512.0F * rbuf [j] ;
	}
	this_descr [j] = x ;
	}
	descr.push_back(this_descr);
	++ nframes ;
	} /* next orientation */
	} /* next keypoint */
	} /* next octave */


	int number_desc = nframes;
	cout << "sift detect points numbers: " << number_desc << endl;
	int tframeNum = 483;
	cout << "frame at " << tframeNum << endl;
	for (int i = 0; i < 4; ++i)
	cout << frames[tframeNum][i] << "\t";
	cout << endl;
	cout << "descr at " << tframeNum << endl;
	for (int i = 0; i < 128; ++i)
	cout << descr[tframeNum][i] << "\t";
	cout << endl;

	// Clean up
	/* release filter */
	if (filt) {
	vl_sift_delete(filt);
	filt = 0;
	}
	/* release image data */
	if (data) {
	delete[] data;
	data = 0 ;
	}
	system("pause");
	return 0;
	}