Skip to content

Instantly share code, notes, and snippets.

@joaovissoci
Created October 16, 2014 16:37
Show Gist options
  • Save joaovissoci/d346ab6bcec8a996e174 to your computer and use it in GitHub Desktop.
Save joaovissoci/d346ab6bcec8a996e174 to your computer and use it in GitHub Desktop.
taxometric_template.R
### ANALISE TAXOMETRICA COM O PACOTE R DE JOHN RUSCIO
# BANCO DE DADOS PARA AS ANALISES
#####
#Preparar um banco com dois ou mais indicadores (algumas an·lises requerem trÍs, como MAXCOV e MAXHEIG), sendo que os "indicadores"
#s„o escores brutos em escalas ou escores compostos (ponderados ou n„o). Uma alternativa, que pode ajudar na interpretaÁ„o das curvas, È utilizar
#escores padronizados dos indicadores, embora seja ˙til relatar tambÈm as informaÁıes descritivas da escala original dos indicadores. Se os
#indicadores forem padronizados, lembrar de n„o deixar valores decimais com vÌrgula, que o R n„o reconhece. … necess·rio usar pontos (se n„o
#der certo a substituiÁ„o das vÌrgulas por pontos no Excel, reduzir para duas casas decimais, copiar, colar no TexPad, substituir, colar de volta
#no Excel e salvar). … recomend·vel tambÈm conferir as opÁıes de an·lise oferecidas no manual, uma vez que alguns dos programas do pacote oferecem a opÁ„o de padronizar
#os indicadores para as an·lises.
#Deve haver uma coluna com uma vari·vel grupo, que pode ser 1 = abaixo o escore z = 0 para o somatÛrio total dos indicadores e 2 = acima do escores z = 0 (>0,00001). Usar a função scale para transformar em z score.
#####
#Abrir o banco com o nome "data1" (no exemplo abaixo, sem headers e salvo em ".csv").
data1<-read.table(file.choose(), header=F, sep="\t")
#Creting a sample dataset
#Str argument = Dim for Dimensional or Cat for Categorical
TestCat <- CreateData(Str = "Cat", N = 1000, k = 4, P = .25, d = 2.00)
TestDim <- CreateData(Str = "Dim", N = 1000, k = 4, P = .25, d = 2.00)
#A anAlise descritiva dos indicadores È dada por:
Indicator.Dist(TestDim)
## MEAN ABOVE MINUS BELOW A CUT (MAMBAC) TAXOMETRIC ANALYSIS:
#Roda com a sintaxe:
MAMBAC(TestDim[,1:3], Comp.Data = T)
# "T" È usado para a criaÁ„o de 100 amostras de comparaÁ„o (100 para uma condiÁ„o de taxonia e 100 para uma condiÁ„o de dimensionalidade), a partir de uma populaÁ„o
simulada de 100000 indivÌduos, para a qual os indicadores apresentam as mesmas caracterÌsticas daqueles do banco de dados imputado.
Essas amostras simulam o que seria esperado se os dados utilizados fossem gerados por uma taxon ou por uma dimens„o latente. Fornecem,
assim, uma base de comparaÁ„o para os dados analisados, sendo computados resÌduos para a curva observada e as curvas geradas pelas condiÁıes
de taxon e de dimens„o latente. Caso n„o se queira utilizar dados simulados para a comparaÁ„o, deve-se especificar "Com.Data=F".
3. MAXIMUM COVARIANCE (MAXCOV) e MAXIMUM EIGENVALUE (MAXEIG) TAXOMETRIC ANALYSES:
Roda com a sintaxe:
MAXEIG(data1[,1:5], Comp.Data = T, Ind.Triplets = T, Replications = 10)
* "Ind.Triplets = T" especifica que todos os trÍs indicadores ser„o utilizados como vari·veis de imput e output, maximizando
o n˙mero de curvas (e de estimativas de frequÍncias de base), o que melhora os testes de consistÍncia.
* "Replications = 10" especifica a criaÁ„o de 10 subamostras dos dados, sendo os resultados baseados na mÈdia das 10 an·lises.
… adequado para tamanhos amostrais pequenos. Deve ser usado com cautela: quanto maior o n˙mero de replicaÁıes, maior o n˙mero de pontos na curva,
mas tambÈm maior o erro amostral.
Para salvar as classificaÁıes obtidas, usar:
Classes <- MAXEIG(data1[,1:3], Save.Class = 1)
4. L-MODE FACTOR ANALYSIS:
Roda com a sintaxe:
LMode(data1[,1:5], Mode.R = 0)
* "Mode.R = 0" define a regi„o, em escore z, onde o programa deve procurar pela moda da taxon. Deve-se rodar o programa uma vez, avaliar o gr·fico
e especificar novamente, para refinar a an·lise. Quanto menor a frequÍncia de base esperada, maior o valor de "Mode.R". Caso seja tomada a decis„o
de modificar o valor, consultar o manual do pacote para saber como modificar tambÈm o valor de "Mode.L".
5. MAXSLOPE TAXOMETRIC ANALYSIS:
⁄til para situaÁıes em que apenas dois indicadores est„o disponÌveis, sendo mais adequado usar MAXCOV ou MAXEIG quando h· mais de dois.
Roda com a sintaxe:
MAXSLOPE(data1[,4:5])
6. CRIANDO DADOS SIMULADOS PARA CONDI«’ES DE TAXON E DIMENS√O
Exemplos (cria um objeto "TestCat" ou "TestDim", que pode ser verificado ao digitar o nome do objeto, posteriormente):
TestCat <- CreateData(Str = "Cat", N = 1000, k = 4, P = .25, d = 2.00)
Cria um banco taxÙnico com 1000 casos, quatro indicadores, frequencia de base de 25% e indicadores com validade de 2.0
TestDim <- CreateData(Str = "Dim", N = 1000, k = 4, P = .25, d = 2.00)
Cria um banco dimensional com 1000 casos, quatro indicadores, correlaÁıes an·logas a uma frequÍncia de base de 25% e validade dos indicadores de 2.0
Em que:
a. "Str = "Dim"" para dados dimensionais, "Str = "Cat"" para dados taxÙnicos
b. N = o n˙mero de casos desejados
c. k = o n˙mero de indicadores desejados
d. P = a frequÍncia de base para a taxon
e. d = a validade dos indicadores (no mÌnimo, 1.25)
*È possÌvel omitir a validade dos indicadores na sintaxe, j· que o default È 2.0
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment