Gustavo Frederico gcsfred

## AuthConfig.cs
using System;
using System.Collections.Generic;
using System.Linq;
using System.Text;
using Microsoft.Web.WebPages.OAuth;
using WebMatrix.WebData;

namespace TesteSimpleMembershipEmpty
{
    public static class AuthConfig

## web.config
<?xml version="1.0" encoding="utf-8"?>
<!--
  Para obter mais informações sobre como configurar o aplicativo ASP.NET, visite
  http://go.microsoft.com/fwlink/?LinkId=169433
  -->
<configuration>
  <configSections>
    <!-- For more information on Entity Framework configuration, visit http://go.microsoft.com/fwlink/?LinkID=237468 -->
    <section name="entityFramework" type="System.Data.Entity.Internal.ConfigFile.EntityFrameworkSection, EntityFramework, Version=5.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" requirePermission="false" />
    <sectionGroup name="dotNetOpenAuth" type="DotNetOpenAuth.Configuration.DotNetOpenAuthSection, DotNetOpenAuth.Core">

## sample.py
from pyspark.ml.feature import StringIndexer
from pyspark.ml.feature import OneHotEncoder

# ...

def one_hot_encode(_df, input_column, output_column):
    indexer = StringIndexer(inputCol=input_column, outputCol=input_column+"_indexed", handleInvalid='skip')
    _model = indexer.fit(_df)
    _td = _model.transform(_df)
    encoder = OneHotEncoder(inputCol=input_column+"_indexed", outputCol=output_column, dropLast=True)

## pandas_udf_sample.py
from pyspark.sql.functions import pandas_udf

#...


# Use pandas_udf to define a Pandas UDF
@pandas_udf('string')
# Input/output are both a pandas.Series of string
def pandas_not_null(s):
    return s.fillna("_NO_₦Ӑ_").replace('', '_NO_ӖӍΡṬΫ_')

## dataframe_using_pandas_udf.py
dataframe = dataframe.withColumn('ACOLUMN_not_null', pandas_not_null('ACOLUMN'))
dataframe = one_hot_encode(dataframe, "ACOLUMN_not_null", "ACOLUMN_one_hot")

## pandas_udf_nlp.py
import pandas as pd
from pyspark.sql.functions import pandas_udf, PandasUDFType
import spacy

#...
# nlp = spacy.load('en_core_web_lg')
nlp = spacy.load('en_core_web_sm')
#...

# Use pandas_udf to define a Pandas UDF

## dataframe_using_pandas_udf.py
dataframe = dataframe.withColumn('description_vec', pandas_nlp('description'))

## udf_two_columns_concat.py
import pyspark.sql.functions as f
import pyspark.sql.types as t

# ...
def udf_concat_vec(a, b):
    # a and b of type SparseVector
    return np.concatenate((a.toArray(), b.toArray())).tolist()


my_udf_concat_vec = f.UserDefinedFunction(udf_concat_vec, t.ArrayType(t.FloatType()))

## UDF_variable_num_columns.py
import pyspark.sql.functions as f
import pyspark.sql.types as t

# ...

data_frame = data_frame.withColumn('columnB', data_frame['columnA'])
data_frame = data_frame.withColumn('columnC', data_frame['columnA'])
attrs = ['columnA', 'columnB', 'columnC']


## search_with_personalization_fragment.py

def search_with_personalization(user, search):
    config = configparser.ConfigParser()
    config.read('config.conf')
    categories = get_category_recommendations(config, user)
    ranked_categories = get_category_ranking(config, user, categories)
    products = get_product_recommendations(config, user)
    ranked_products = get_product_ranking(config, user, products)
    query_es(search, ranked_categories, ranked_products)
	using System;
	using System.Collections.Generic;
	using System.Linq;
	using System.Text;
	using Microsoft.Web.WebPages.OAuth;
	using WebMatrix.WebData;

	namespace TesteSimpleMembershipEmpty
	{
	public static class AuthConfig
	<?xml version="1.0" encoding="utf-8"?>
	<!--
	Para obter mais informações sobre como configurar o aplicativo ASP.NET, visite
	http://go.microsoft.com/fwlink/?LinkId=169433
	-->
	<configuration>
	<configSections>
	<!-- For more information on Entity Framework configuration, visit http://go.microsoft.com/fwlink/?LinkID=237468 -->
	<section name="entityFramework" type="System.Data.Entity.Internal.ConfigFile.EntityFrameworkSection, EntityFramework, Version=5.0.0.0, Culture=neutral, PublicKeyToken=b77a5c561934e089" requirePermission="false" />
	<sectionGroup name="dotNetOpenAuth" type="DotNetOpenAuth.Configuration.DotNetOpenAuthSection, DotNetOpenAuth.Core">
	from pyspark.ml.feature import StringIndexer
	from pyspark.ml.feature import OneHotEncoder

	# ...

	def one_hot_encode(_df, input_column, output_column):
	indexer = StringIndexer(inputCol=input_column, outputCol=input_column+"_indexed", handleInvalid='skip')
	_model = indexer.fit(_df)
	_td = _model.transform(_df)
	encoder = OneHotEncoder(inputCol=input_column+"_indexed", outputCol=output_column, dropLast=True)
	from pyspark.sql.functions import pandas_udf

	#...


	# Use pandas_udf to define a Pandas UDF
	@pandas_udf('string')
	# Input/output are both a pandas.Series of string
	def pandas_not_null(s):
	return s.fillna("_NO_₦Ӑ_").replace('', '_NO_ӖӍΡṬΫ_')
	dataframe = dataframe.withColumn('ACOLUMN_not_null', pandas_not_null('ACOLUMN'))
	dataframe = one_hot_encode(dataframe, "ACOLUMN_not_null", "ACOLUMN_one_hot")
	import pandas as pd
	from pyspark.sql.functions import pandas_udf, PandasUDFType
	import spacy

	#...
	# nlp = spacy.load('en_core_web_lg')
	nlp = spacy.load('en_core_web_sm')
	#...

	# Use pandas_udf to define a Pandas UDF
	import pyspark.sql.functions as f
	import pyspark.sql.types as t

	# ...
	def udf_concat_vec(a, b):
	# a and b of type SparseVector
	return np.concatenate((a.toArray(), b.toArray())).tolist()


	my_udf_concat_vec = f.UserDefinedFunction(udf_concat_vec, t.ArrayType(t.FloatType()))

	def search_with_personalization(user, search):
	config = configparser.ConfigParser()
	config.read('config.conf')
	categories = get_category_recommendations(config, user)
	ranked_categories = get_category_ranking(config, user, categories)
	products = get_product_recommendations(config, user)
	ranked_products = get_product_ranking(config, user, products)
	query_es(search, ranked_categories, ranked_products)