nportinari/strip_ctn.txt

## strip_ctn.txt
#Função para procurar substrings em um dataframe sem se preocupar com a acentuação

import re
import unicodedata

def strip_ctn(x, y):

    # Tira os acentos e confere se x contém o valor y
    # O x aponta para a referência de localização no DataFrame, o y, para a string procurada

    text = y
    try:
        text = unicode(text, 'utf-8')
    except (TypeError, NameError): # unicode is a default on python 3
        pass
    text = unicodedata.normalize('NFD', text)
    text = text.encode('ascii', 'ignore')
    text = text.decode("utf-8")

    text2 = x
    try:
        text = unicode(text, 'utf-8')
    except (TypeError, NameError): # unicode is a default on python 3
        pass
    text = unicodedata.normalize('NFD', text)
    text = text.encode('ascii', 'ignore')
    text = text.decode("utf-8")

    return text2.str.contains(text, na=False, case = False)
	#Função para procurar substrings em um dataframe sem se preocupar com a acentuação

	import re
	import unicodedata

	def strip_ctn(x, y):

	# Tira os acentos e confere se x contém o valor y
	# O x aponta para a referência de localização no DataFrame, o y, para a string procurada

	text = y
	try:
	text = unicode(text, 'utf-8')
	except (TypeError, NameError): # unicode is a default on python 3
	pass
	text = unicodedata.normalize('NFD', text)
	text = text.encode('ascii', 'ignore')
	text = text.decode("utf-8")

	text2 = x
	try:
	text = unicode(text, 'utf-8')
	except (TypeError, NameError): # unicode is a default on python 3
	pass
	text = unicodedata.normalize('NFD', text)
	text = text.encode('ascii', 'ignore')
	text = text.decode("utf-8")

	return text2.str.contains(text, na=False, case = False)