janxkoci/plink_cluster_bfile.sh

## plink_cluster_bfile.sh
#!/bin/bash

## PLINK CLUSTERING (plink1.9)
## takes input (any path) and creates clustering reports in working dir (to not mix data and results)

## OUTPUT PREFIX
prefix=$1

## MDS DIMENSIONS (optional, default = 2)
dims=${2:-2}

## LD PRUNNING
## https://www.cog-genomics.org/plink/1.9/ld#indep
plink --indep 50 5 2 --bfile $prefix --out $prefix

## DISTANCE
## https://www.cog-genomics.org/plink/1.9/ibd
## https://www.cog-genomics.org/plink/1.9/distance
plink --bfile $prefix --genome --out $prefix --extract ${prefix}.prune.in --recode # --distance --distance-matrix

## CLUSTERING
## https://www.cog-genomics.org/plink/1.9/strat

## MDS
plink --file $prefix --read-genome ${prefix}.genome --cluster --mds-plot $dims --out ${prefix}_${dims} # --read-dists ${prefix}.dists

## PCA
plink --file $prefix --read-genome ${prefix}.genome --cluster --pca --out ${prefix} # --read-dists ${prefix}.dists

## plink_cluster_vcf.sh
#!/bin/bash

## PLINK CLUSTERING (plink1.9)
## takes input (any path) and creates clustering reports in working dir (to not mix data and results)

## OUTPUT PREFIX
prefix=$(basename -s .gz $1) # remove .gz if present
prefix=$(basename -s .vcf $prefix) # remove also .vcf

## MDS DIMENSIONS (optional, default = 2)
dims=${2:-2}

## LD PRUNNING
## https://www.cog-genomics.org/plink/1.9/ld#indep
plink --indep 50 5 2 --vcf $1 --out $prefix

## DISTANCE
## https://www.cog-genomics.org/plink/1.9/ibd
## https://www.cog-genomics.org/plink/1.9/distance
plink --vcf $1 --genome --out $prefix --extract ${prefix}.prune.in --recode # --distance --distance-matrix

## CLUSTERING
## https://www.cog-genomics.org/plink/1.9/strat

## MDS
plink --file $prefix --read-genome ${prefix}.genome --cluster --mds-plot $dims --out ${prefix}_${dims} # --read-dists ${prefix}.dists

## PCA
plink --file $prefix --read-genome ${prefix}.genome --cluster --pca --out ${prefix} # --read-dists ${prefix}.dists
	#!/bin/bash

	## PLINK CLUSTERING (plink1.9)
	## takes input (any path) and creates clustering reports in working dir (to not mix data and results)

	## OUTPUT PREFIX
	prefix=$1

	## MDS DIMENSIONS (optional, default = 2)
	dims=${2:-2}

	## LD PRUNNING
	## https://www.cog-genomics.org/plink/1.9/ld#indep
	plink --indep 50 5 2 --bfile $prefix --out $prefix

	## DISTANCE
	## https://www.cog-genomics.org/plink/1.9/ibd
	## https://www.cog-genomics.org/plink/1.9/distance
	plink --bfile $prefix --genome --out $prefix --extract ${prefix}.prune.in --recode # --distance --distance-matrix

	## CLUSTERING
	## https://www.cog-genomics.org/plink/1.9/strat

	## MDS
	plink --file $prefix --read-genome ${prefix}.genome --cluster --mds-plot $dims --out ${prefix}_${dims} # --read-dists ${prefix}.dists

	## PCA
	plink --file $prefix --read-genome ${prefix}.genome --cluster --pca --out ${prefix} # --read-dists ${prefix}.dists