soren/WordCount.pm

## WordCount.pm
package My::Hadoop::WordCount;
use Any::Moose qw(Role);

sub map {
    my ($self, $line) = @_;

    $self->emit(lc $_ => 1) foreach split /[\s.,:;!?]+/, $line;
}

sub reduce {
    my ($self, $key, $values) = @_;
    my $count = 0;

    while ($values->has_next) {
        $count++;
        $values->next;
    }

    $self->emit($key, $count);
}

package My::Hadoop::WordCount::Mapper;
use Any::Moose;
with qw(Hadoop::Streaming::Mapper My::Hadoop::WordCount);

package My::Hadoop::WordCount::Reducer;
use Any::Moose;
with qw(Hadoop::Streaming::Reducer  My::Hadoop::WordCount);

1;
	package My::Hadoop::WordCount;
	use Any::Moose qw(Role);

	sub map {
	my ($self, $line) = @_;

	$self->emit(lc $_ => 1) foreach split /[\s.,:;!?]+/, $line;
	}

	sub reduce {
	my ($self, $key, $values) = @_;
	my $count = 0;

	while ($values->has_next) {
	$count++;
	$values->next;
	}

	$self->emit($key, $count);
	}

	package My::Hadoop::WordCount::Mapper;
	use Any::Moose;
	with qw(Hadoop::Streaming::Mapper My::Hadoop::WordCount);

	package My::Hadoop::WordCount::Reducer;
	use Any::Moose;
	with qw(Hadoop::Streaming::Reducer My::Hadoop::WordCount);

	1;