gabraganca/get_movies.py

## get_movies.py
def get_rec_movies(user_id:str, algoritmo, n_top: int =10) -> pd.DataFrame:
    """
    Obtém uma lista de recomendação para N filmes para um
    usuário.

    Parameters:
        user_id: o ID do usuário
        n_top: O número de filmes desejados

    Returns:
        Um DataFrame com o ID dos filmes, nome e gênero.
    """
    all_movie_id = set(df_ratings['movieId'].unique())
    rated_movies = set(df_ratings.query(f"userId == '{user_id}'")['movieId'].values)
    unrated_movies = list(all_movie_id.difference(rated_movies))

    # top N movies
    top_movies = pd.Series(unrated_movies, index=unrated_movies)\
                    .map(lambda movie_id:  algoritmo.predict(user_id, movie_id).est)\
                    .sort_values(ascending=False)[:n_top]\
                    .rename('pred_rating')\
                    .reset_index()\
                    .rename(columns=dict(index='movieId'))\
                    .merge(df_movies, on='movieId')\
                    .set_index('movieId')

    return top_movies[['title', 'genres', 'pred_rating']]

get_rec_movies('Esposa', algo_base)
	def get_rec_movies(user_id:str, algoritmo, n_top: int =10) -> pd.DataFrame:
	"""
	Obtém uma lista de recomendação para N filmes para um
	usuário.

	Parameters:
	user_id: o ID do usuário
	n_top: O número de filmes desejados

	Returns:
	Um DataFrame com o ID dos filmes, nome e gênero.
	"""
	all_movie_id = set(df_ratings['movieId'].unique())
	rated_movies = set(df_ratings.query(f"userId == '{user_id}'")['movieId'].values)
	unrated_movies = list(all_movie_id.difference(rated_movies))

	# top N movies
	top_movies = pd.Series(unrated_movies, index=unrated_movies)\
	.map(lambda movie_id: algoritmo.predict(user_id, movie_id).est)\
	.sort_values(ascending=False)[:n_top]\
	.rename('pred_rating')\
	.reset_index()\
	.rename(columns=dict(index='movieId'))\
	.merge(df_movies, on='movieId')\
	.set_index('movieId')

	return top_movies[['title', 'genres', 'pred_rating']]

	get_rec_movies('Esposa', algo_base)