Skip to content

Instantly share code, notes, and snippets.

@boniattirodrigo
Last active December 28, 2023 18:38
Show Gist options
  • Save boniattirodrigo/67429ada53b7337d2e79 to your computer and use it in GitHub Desktop.
Save boniattirodrigo/67429ada53b7337d2e79 to your computer and use it in GitHub Desktop.
Remover acentos e caracteres especiais em Python
import unicodedata
import re
"""
A remoção de acentos foi baseada em uma resposta no Stack Overflow.
http://stackoverflow.com/a/517974/3464573
"""
def removerAcentosECaracteresEspeciais(palavra):
# Unicode normalize transforma um caracter em seu equivalente em latin.
nfkd = unicodedata.normalize('NFKD', palavra)
palavraSemAcento = u"".join([c for c in nfkd if not unicodedata.combining(c)])
# Usa expressão regular para retornar a palavra apenas com números, letras e espaço
return re.sub('[^a-zA-Z0-9 \\\]', '', palavraSemAcento)
@winston2016
Copy link

Very Nice !

@renatopejon
Copy link

Muito útil.

Parabéns e muito obrigado.

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment