Skip to content

Instantly share code, notes, and snippets.

@alopes
Created April 10, 2013 20:32
Show Gist options
  • Save alopes/5358189 to your computer and use it in GitHub Desktop.
Save alopes/5358189 to your computer and use it in GitHub Desktop.
Portuguese stop words
de
a
o
que
e
do
da
em
um
para
é
com
não
uma
os
no
se
na
por
mais
as
dos
como
mas
foi
ao
ele
das
tem
à
seu
sua
ou
ser
quando
muito
nos
está
eu
também
pelo
pela
até
isso
ela
entre
era
depois
sem
mesmo
aos
ter
seus
quem
nas
me
esse
eles
estão
você
tinha
foram
essa
num
nem
suas
meu
às
minha
têm
numa
pelos
elas
havia
seja
qual
será
nós
tenho
lhe
deles
essas
esses
pelas
este
fosse
dele
tu
te
vocês
vos
lhes
meus
minhas
teu
tua
teus
tuas
nosso
nossa
nossos
nossas
dela
delas
esta
estes
estas
aquele
aquela
aqueles
aquelas
isto
aquilo
estou
está
estamos
estão
estive
esteve
estivemos
estiveram
estava
estávamos
estavam
estivera
estivéramos
esteja
estejamos
estejam
estivesse
estivéssemos
estivessem
estiver
estivermos
estiverem
hei
havemos
hão
houve
houvemos
houveram
houvera
houvéramos
haja
hajamos
hajam
houvesse
houvéssemos
houvessem
houver
houvermos
houverem
houverei
houverá
houveremos
houverão
houveria
houveríamos
houveriam
sou
somos
são
era
éramos
eram
fui
foi
fomos
foram
fora
fôramos
seja
sejamos
sejam
fosse
fôssemos
fossem
for
formos
forem
serei
será
seremos
serão
seria
seríamos
seriam
tenho
tem
temos
tém
tinha
tínhamos
tinham
tive
teve
tivemos
tiveram
tivera
tivéramos
tenha
tenhamos
tenham
tivesse
tivéssemos
tivessem
tiver
tivermos
tiverem
terei
terá
teremos
terão
teria
teríamos
teriam
@vagnerasilva
Copy link

firmeza

@larifeliciana
Copy link

Boa. Valeu! 💃

@brizzio
Copy link

brizzio commented May 23, 2019

eu traduzi uma lista de stopwords em ingles...algumas coincidem com a lista acima. obrigado lopes!!!

a uma
about sobre
above acima
across através
after depois de
again novamente
against contra
all todos
almost quase
alone sozinho
along ao longo
already
also além disso
although apesar
always sempre
among entre
an a
and e
another outro
any qualquer
anybody qualquer pessoa
anyone qualquer um
anything qualquer coisa
anywhere qualquer lugar
are está
area área
areas areas
around por aí
as como
ask pergunte
asked perguntei
asking perguntando
asks pergunta
at a
away longe
b b
back de volta
backed apoiado
backing apoio
backs costas
be estar
became passou a ser
because porque
become tornar-se
becomes torna-se
been fui
before antes
began começasse
behind atrás
being ser
beings seres
best melhor
better melhor
between entre
big grande
both ambos
but mas
by por
c c
came veio
can posso
cannot não podes
case caso
cases casos
certain certo
certainly certamente
clear claro
clearly claramente
come venha
could poderia
d d
did fez
differ diferir
different diferente
differently diferentemente
do faz
does faz
done feito
down baixa
downed abatido
downing derrubada
downs baixos
during durante
e e
each cada
early cedo
either ou
end fim
ended terminou
ending final
ends termina
enough o suficiente
even até
evenly uniformemente
ever sempre
every cada
everybody todo o mundo
everyone todos
everything tudo
everywhere em toda parte
f f
face face
faces rostos
fact facto
facts factos
far longe
felt sentido
few poucos
find encontrar
finds encontra
first primeiro
for para
four quatro
from de
full cheio
fully totalmente
further mais distante
furthered promovido
furthering promovendo
furthers promove
g g
gave deu
general geral
generally geralmente
get pegue
gets fica
give dar
given dado
gives
go vai
going indo
good boa
goods mercadorias
got obteve
great ótimo
greater maior
greatest maior
group grupo
grouped agrupado
grouping agrupamento
groups grupos
h h
had teve
has tem
have ter
having tendo
he ele
her dela
here aqui
herself ela própria
high alto
higher superior
highest maior
him ele
himself ele mesmo
his dele
how como
however contudo
i eu
if e se
important importante
in em
interest interesse
interested interessado
interesting interessante
interests interesses
into para dentro
is é
it isto
its está
itself em si
j j
just somente
k k
keep manter
keeps mantém
kind tipo
knew sabia
know conhecer
known conhecido
knows sabe
l eu
large ampla
largely largamente
last último
later mais tarde
latest mais recentes
least menos
less menos
let deixei
lets vamos deixar
like gostar
likely provável
long longo
longer mais longo
longest mais longo
m m
made fez
make faço
making fazer
man homem
many muitos
may maio
me mim
member membro
members membros
men homens
might poderia
more mais
most a maioria
mostly na maioria das vezes
mr sr
mrs sra
much muito de
must devo
my minha
myself eu mesmo
n n
necessary necessário
need precisar
needed necessário
needing precisando
needs necessidades
never nunca
new novo
newer mais recente
newest o mais novo
next próximo
no não
nobody ninguém
non não
noone ninguém
not não
nothing nada
now agora
nowhere lugar algum
number número
numbers números
o o
of do
off fora
often frequentemente
old velho
older mais velho
oldest mais antigo
on em
once uma vez
one um
only
open abrir
opened aberto
opening abertura
opens abre
or ou
order ordem
ordered encomendado
ordering encomenda
orders encomendas
other de outros
others outras
our nosso
out fora
over sobre
p p
part parte
parted se separaram
parting despedida
parts partes
per por
perhaps possivelmente
place lugar, colocar
places locais
point ponto
pointed apontou
pointing apontando
points pontos
possible possível
present presente
presented apresentado
presenting apresentar
presents presentes
problem problema
problems problemas
put colocar
puts coloca
q q
quite bastante
r r
rather em vez
really realmente
right certo
room sala
rooms quartos
s s
said disse
same mesmo
saw serra
say dizer
says diz
second segundo
seconds segundos
see vejo
seem parece
seemed parecia
seeming aparente
seems parece
sees
several de várias
shall deve
she ela
should devemos
show exposição
showed mostrou
showing mostrando
shows shows
side lado
sides lados
since desde a
small pequeno
smaller menor
smallest menor
so assim
some alguns
somebody alguém
someone alguém
something alguma coisa
somewhere algum lugar
state estado
states estados
still ainda
such tal
sure certo
t t
take leva
taken ocupado
than do que
that naquela
the a
their seus
them eles
then então
there
therefore assim sendo
these estes
they eles
thing coisa
things coisas
think pensar
thinks acha
this isto
those essa
though apesar
thought pensamento
thoughts pensamentos
three três
through através
thus portanto
to para
today hoje
together juntos
too também
took tomou
toward em direção a
turn virar
turned virou
turning girando
turns voltas
two dois
u você
under debaixo
until até
up acima
upon sobre
us nos
use usar
used usava
uses usa
v v
very muito
w w
want quer
wanted procurado
wanting querendo
wants quer
was estava
way caminho
ways maneiras
we nós
well bem
wells poços
went foi
were estavam
what que
when quando
where onde
whether se
which qual
while enquanto
who quem
whole todo
whose de quem
why porque
will vai
with com
within dentro
without sem
work trabalhos
worked trabalhado
working trabalhando
works trabalho
would seria
x x
y y
year ano
years anos
yet ainda
you você
young jovem
younger mais jovem
youngest mais jovem
your seu
yours sua
z z
share compartilhar
linkthese linkthese
am sou
aren't não são
below abaixo
can't não pode
couldn't não podia
didn't não fez
doesn't não faz
doing fazendo
don't não faça
hadn't não tinha
hasn't não tem
haven't não tem
he'd ele tinha
he'll inferno
he's ele é
here's aqui está
hers dela
how's como está
i'd identidade
i'll eu vou
i'm eu estou
i've eu tenho
isn't não é
it's está
let's vamos
mustn't não deve
nor nem
ought deveria
ours nosso
ourselves nós mesmos
own próprio
shan't shan't
she'd ela
she'll ela vai
she's ela é
shouldn't não deveria
that's isso é
theirs deles
themselves si mesmos
there's
they'd eles tinham
they'll eles vão
they're eles estão
they've eles já
wasn't não foi
we'd qua
we'll bem
we're estamos
we've nós temos
weren't não estava
what's o que é
when's quando é
where's onde está a
who's quem é
whom o qual
why's por que
won't não vai
wouldn't não faria
you'd você gostaria
you'll você vai
you're você é
you've você tem
yourself você mesmo
yourselves vocês mesmos

@Cristianasp
Copy link

Opa ! Obrigada ! Ajudou bastante aqui.

@lucasguiss
Copy link

Muito útil, obrigado!!

@airtonbjunior
Copy link

Obrigado!

@tales-lopes
Copy link

tales-lopes commented Jun 27, 2020

Eu coloquei em formato de lista para facilitar :)

['de', 'a', 'o', 'que', 'e', 'do', 'da', 'em', 'um', 'para', 'é', 'com', 'não', 'uma', 'os', 'no', 'se', 'na', 'por', 'mais', 'as', 'dos', 'como', 'mas', 'foi', 'ao', 'ele', 'das', 'tem', 'à', 'seu', 'sua', 'ou', 'ser', 'quando', 'muito', 'há', 'nos', 'já', 'está', 'eu', 'também', 'só', 'pelo', 'pela', 'até', 'isso', 'ela', 'entre', 'era', 'depois', 'sem', 'mesmo', 'aos', 'ter', 'seus', 'quem', 'nas', 'me', 'esse', 'eles', 'estão', 'você', 'tinha', 'foram', 'essa', 'num', 'nem', 'suas', 'meu', 'às', 'minha', 'têm', 'numa', 'pelos', 'elas', 'havia', 'seja', 'qual', 'será', 'nós', 'tenho', 'lhe', 'deles', 'essas', 'esses', 'pelas', 'este', 'fosse', 'dele', 'tu', 'te', 'vocês', 'vos', 'lhes', 'meus', 'minhas', 'teu', 'tua', 'teus', 'tuas', 'nosso', 'nossa', 'nossos', 'nossas', 'dela', 'delas', 'esta', 'estes', 'estas', 'aquele', 'aquela', 'aqueles', 'aquelas', 'isto', 'aquilo', 'estou', 'está', 'estamos', 'estão', 'estive', 'esteve', 'estivemos', 'estiveram', 'estava', 'estávamos', 'estavam', 'estivera', 'estivéramos', 'esteja', 'estejamos', 'estejam', 'estivesse', 'estivéssemos', 'estivessem', 'estiver', 'estivermos', 'estiverem', 'hei', 'há', 'havemos', 'hão', 'houve', 'houvemos', 'houveram', 'houvera', 'houvéramos', 'haja', 'hajamos', 'hajam', 'houvesse', 'houvéssemos', 'houvessem', 'houver', 'houvermos', 'houverem', 'houverei', 'houverá', 'houveremos', 'houverão', 'houveria', 'houveríamos', 'houveriam', 'sou', 'somos', 'são', 'era', 'éramos', 'eram', 'fui', 'foi', 'fomos', 'foram', 'fora', 'fôramos', 'seja', 'sejamos', 'sejam', 'fosse', 'fôssemos', 'fossem', 'for', 'formos', 'forem', 'serei', 'será', 'seremos', 'serão', 'seria', 'seríamos', 'seriam', 'tenho', 'tem', 'temos', 'tém', 'tinha', 'tínhamos', 'tinham', 'tive', 'teve', 'tivemos', 'tiveram', 'tivera', 'tivéramos', 'tenha', 'tenhamos', 'tenham', 'tivesse', 'tivéssemos', 'tivessem', 'tiver', 'tivermos', 'tiverem', 'terei', 'terá', 'teremos', 'terão', 'teria', 'teríamos', 'teriam']

@AugustoBarros
Copy link

AugustoBarros commented Aug 19, 2020

Para deixar de contribuição: 😄

Você pode importar uma lista de stop_words em português do módulo ntlk. e.g:

Instalação 🔧

pip install nltk

Uso 💪

>>> from nltk.corpus import stopwords
>>> pt_stp_words = stopwords.words('portuguese')
>>> pt_stp_words[:10]
['a', 'ao', 'aos', 'aquela', 'aquelas', 'aquele', 'aqueles', 'aquilo', 'as', 'até']

Referências 🤓

@thaisvilarinho
Copy link

Muito obrigada, ajudou muito.

@caioerick
Copy link

Muito bom! obrigado pela dica 👍

@snippet
Copy link

snippet commented Sep 27, 2020

Sem acentuação:

['de','a','o','que','e','do','da','em','um','para','e','com','nao','uma','os','no','se','na','por','mais','as','dos','como','mas','foi','ao','ele','das','tem','a','seu','sua','ou','ser','quando','muito','ha','nos','ja','esta','eu','tambem','so','pelo','pela','ate','isso','ela','entre','era','depois','sem','mesmo','aos','ter','seus','quem','nas','me','esse','eles','estao','voce','tinha','foram','essa','num','nem','suas','meu','as','minha','tem','numa','pelos','elas','havia','seja','qual','sera','nos','tenho','lhe','deles','essas','esses','pelas','este','fosse','dele','tu','te','voces','vos','lhes','meus','minhas','teu','tua','teus','tuas','nosso','nossa','nossos','nossas','dela','delas','esta','estes','estas','aquele','aquela','aqueles','aquelas','isto','aquilo','estou','esta','estamos','estao','estive','esteve','estivemos','estiveram','estava','estavamos','estavam','estivera','estiveramos','esteja','estejamos','estejam','estivesse','estivessemos','estivessem','estiver','estivermos','estiverem','hei','ha','havemos','hao','houve','houvemos','houveram','houvera','houveramos','haja','hajamos','hajam','houvesse','houvessemos','houvessem','houver','houvermos','houverem','houverei','houvera','houveremos','houverao','houveria','houveriamos','houveriam','sou','somos','sao','era','eramos','eram','fui','foi','fomos','foram','fora','foramos','seja','sejamos','sejam','fosse','fossemos','fossem','for','formos','forem','serei','sera','seremos','serao','seria','seriamos','seriam','tenho','tem','temos','tem','tinha','tinhamos','tinham','tive','teve','tivemos','tiveram','tivera','tiveramos','tenha','tenhamos','tenham','tivesse','tivessemos','tivessem','tiver','tivermos','tiverem','terei','tera','teremos','terao','teria','teriamos','teriam']

@NaelsonDouglas
Copy link

Valeu!

@NaelsonDouglas
Copy link

NaelsonDouglas commented Oct 1, 2020

@AugustoBarros tem um typo na linha from ntlk.corpus import stopwords

nltk ao invés de ntlk.
Eu tentei aqui várias vezes e dando erro. hehe

Mas valeu pela força

@snippet
Copy link

snippet commented Oct 5, 2020

Segue um pacote mais completo:

const words = [ 'a', 'à', 'adeus', 'agora', 'aí', 'ainda', 'além', 'algo', 'alguém', 'algum', 'alguma', 'algumas', 'alguns', 'ali', 'ampla', 'amplas', 'amplo', 'amplos', 'ano', 'anos', 'ante', 'antes', 'ao', 'aos', 'apenas', 'apoio', 'após', 'aquela', 'aquelas', 'aquele', 'aqueles', 'aqui', 'aquilo', 'área', 'as', 'às', 'assim', 'até', 'atrás', 'através', 'baixo', 'bastante', 'bem', 'boa', 'boas', 'bom', 'bons', 'breve', 'cá', 'cada', 'catorze', 'cedo', 'cento', 'certamente', 'certeza', 'cima', 'cinco', 'coisa', 'coisas', 'com', 'como', 'conselho', 'contra', 'contudo', 'custa', 'da', 'dá', 'dão', 'daquela', 'daquelas', 'daquele', 'daqueles', 'dar', 'das', 'de', 'debaixo', 'dela', 'delas', 'dele', 'deles', 'demais', 'dentro', 'depois', 'desde', 'dessa', 'dessas', 'desse', 'desses', 'desta', 'destas', 'deste', 'destes', 'deve', 'devem', 'devendo', 'dever', 'deverá', 'deverão', 'deveria', 'deveriam', 'devia', 'deviam', 'dez', 'dezanove', 'dezasseis', 'dezassete', 'dezoito', 'dia', 'diante', 'disse', 'disso', 'disto', 'dito', 'diz', 'dizem', 'dizer', 'do', 'dois', 'dos', 'doze', 'duas', 'dúvida', 'e', 'é', 'ela', 'elas', 'ele', 'eles', 'em', 'embora', 'enquanto', 'entre', 'era', 'eram', 'éramos', 'és', 'essa', 'essas', 'esse', 'esses', 'esta', 'está', 'estamos', 'estão', 'estar', 'estas', 'estás', 'estava', 'estavam', 'estávamos', 'este', 'esteja', 'estejam', 'estejamos', 'estes', 'esteve', 'estive', 'estivemos', 'estiver', 'estivera', 'estiveram', 'estivéramos', 'estiverem', 'estivermos', 'estivesse', 'estivessem', 'estivéssemos', 'estiveste', 'estivestes', 'estou', 'etc', 'eu', 'exemplo', 'faço', 'falta', 'favor', 'faz', 'fazeis', 'fazem', 'fazemos', 'fazendo', 'fazer', 'fazes', 'feita', 'feitas', 'feito', 'feitos', 'fez', 'fim', 'final', 'foi', 'fomos', 'for', 'fora', 'foram', 'fôramos', 'forem', 'forma', 'formos', 'fosse', 'fossem', 'fôssemos', 'foste', 'fostes', 'fui', 'geral', 'grande', 'grandes', 'grupo', 'há', 'haja', 'hajam', 'hajamos', 'hão', 'havemos', 'havia', 'hei', 'hoje', 'hora', 'horas', 'houve', 'houvemos', 'houver', 'houvera', 'houverá', 'houveram', 'houvéramos', 'houverão', 'houverei', 'houverem', 'houveremos', 'houveria', 'houveriam', 'houveríamos', 'houvermos', 'houvesse', 'houvessem', 'houvéssemos', 'isso', 'isto', 'já', 'la', 'lá', 'lado', 'lhe', 'lhes', 'lo', 'local', 'logo', 'longe', 'lugar', 'maior', 'maioria', 'mais', 'mal', 'mas', 'máximo', 'me', 'meio', 'menor', 'menos', 'mês', 'meses', 'mesma', 'mesmas', 'mesmo', 'mesmos', 'meu', 'meus', 'mil', 'minha', 'minhas', 'momento', 'muita', 'muitas', 'muito', 'muitos', 'na', 'nada', 'não', 'naquela', 'naquelas', 'naquele', 'naqueles', 'nas', 'nem', 'nenhum', 'nenhuma', 'nessa', 'nessas', 'nesse', 'nesses', 'nesta', 'nestas', 'neste', 'nestes', 'ninguém', 'nível', 'no', 'noite', 'nome', 'nos', 'nós', 'nossa', 'nossas', 'nosso', 'nossos', 'nova', 'novas', 'nove', 'novo', 'novos', 'num', 'numa', 'número', 'nunca', 'o', 'obra', 'obrigada', 'obrigado', 'oitava', 'oitavo', 'oito', 'onde', 'ontem', 'onze', 'os', 'ou', 'outra', 'outras', 'outro', 'outros', 'para', 'parece', 'parte', 'partir', 'paucas', 'pela', 'pelas', 'pelo', 'pelos', 'pequena', 'pequenas', 'pequeno', 'pequenos', 'per', 'perante', 'perto', 'pode', 'pude', 'pôde', 'podem', 'podendo', 'poder', 'poderia', 'poderiam', 'podia', 'podiam', 'põe', 'põem', 'pois', 'ponto', 'pontos', 'por', 'porém', 'porque', 'porquê', 'posição', 'possível', 'possivelmente', 'posso', 'pouca', 'poucas', 'pouco', 'poucos', 'primeira', 'primeiras', 'primeiro', 'primeiros', 'própria', 'próprias', 'próprio', 'próprios', 'próxima', 'próximas', 'próximo', 'próximos', 'pude', 'puderam', 'quais', 'quáis', 'qual', 'quando', 'quanto', 'quantos', 'quarta', 'quarto', 'quatro', 'que', 'quê', 'quem', 'quer', 'quereis', 'querem', 'queremas', 'queres', 'quero', 'questão', 'quinta', 'quinto', 'quinze', 'relação', 'sabe', 'sabem', 'são', 'se', 'segunda', 'segundo', 'sei', 'seis', 'seja', 'sejam', 'sejamos', 'sem', 'sempre', 'sendo', 'ser', 'será', 'serão', 'serei', 'seremos', 'seria', 'seriam', 'seríamos', 'sete', 'sétima', 'sétimo', 'seu', 'seus', 'sexta', 'sexto', 'si', 'sido', 'sim', 'sistema', 'só', 'sob', 'sobre', 'sois', 'somos', 'sou', 'sua', 'suas', 'tal', 'talvez', 'também', 'tampouco', 'tanta', 'tantas', 'tanto', 'tão', 'tarde', 'te', 'tem', 'tém', 'têm', 'temos', 'tendes', 'tendo', 'tenha', 'tenham', 'tenhamos', 'tenho', 'tens', 'ter', 'terá', 'terão', 'terceira', 'terceiro', 'terei', 'teremos', 'teria', 'teriam', 'teríamos', 'teu', 'teus', 'teve', 'ti', 'tido', 'tinha', 'tinham', 'tínhamos', 'tive', 'tivemos', 'tiver', 'tivera', 'tiveram', 'tivéramos', 'tiverem', 'tivermos', 'tivesse', 'tivessem', 'tivéssemos', 'tiveste', 'tivestes', 'toda', 'todas', 'todavia', 'todo', 'todos', 'trabalho', 'três', 'treze', 'tu', 'tua', 'tuas', 'tudo', 'última', 'últimas', 'último', 'últimos', 'um', 'uma', 'umas', 'uns', 'vai', 'vais', 'vão', 'vários', 'vem', 'vêm', 'vendo', 'vens', 'ver', 'vez', 'vezes', 'viagem', 'vindo', 'vinte', 'vir', 'você', 'vocês', 'vos', 'vós', 'vossa', 'vossas', 'vosso', 'vossos', 'zero', '1', '2', '3', '4', '5', '6', '7', '8', '9', '0', '_' ]

@KatkayApps
Copy link

Atenção porque muitas das palavras listadas não existem em português. Exemplos: houveremos, houverei, houverem, houvera, houveria, houveriam, queremas e muitas estão escritas erradas, como quáis...

@bruna-garcia
Copy link

Excelente. Muito obrigada!

@benjamimjr
Copy link

Uhuu!!!

@luizchaves97
Copy link

❤️

@LucasMS
Copy link

LucasMS commented Oct 1, 2021

Valeu!

@lgCorb
Copy link

lgCorb commented Apr 2, 2022

Muito bom!

@MBoaretto25
Copy link

Obrigado! Muito bom

@ViniciusARZ
Copy link

Como não amar essa comunidade? Obrigado demais!!

@abralvs
Copy link

abralvs commented Nov 8, 2022

obrigado amigo, você é um amigo kkk 🥉

@rodrigo-marchi
Copy link

Boa

Copy link

ghost commented Feb 10, 2023

Show de bola!

@GIZELLYPY
Copy link

Obrigada!

@ambrosiora
Copy link

Oskey, obrigueido!

@avmcf
Copy link

avmcf commented Oct 20, 2023

Agradeço a todos que colaboram.

@dedemenezes
Copy link

Passando para deixar um generoso abraço à todos os contribuintes desse BELO gist <3

@JoseWalterLima
Copy link

Muito obrigado por este trabalho, salvou demais!!!

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment