Rupert A. Collins boopsboops

## feature_table.R
feature_tab <- paste0(paste0(">Feature", " ", reduced_table$otherCatalogNumbers, "_", gene_name),"\n", #
  "1", "\t", ">", nchar(reduced_table$nucleotides_CYTB), "\t", "gene", "\n", #
  "\t", "\t", "\t", "gene", "\t", gene_name, "\n", #
  "1", "\t", ">", nchar(reduced_table$nucleotides_CYTB), "\t", "CDS", "\t", "\t", "\n", #
  "\t", "\t", "\t", "product", "\t", prod_name, "\n", #
  "\t", "\t", "\t", "codon_start", "\t", "1")
write(feature_tab, file="features.tbl", append=FALSE)# write out

## prod_name.R
gene_name <- "CYTB"
prod_name <- "cytochrome b"

## write_fasta.R
fasta_description <- paste0(">", paste0(reduced_table$otherCatalogNumbers, "_", gene_name), " ", #
  "[organism=", reduced_table$genus, " ", reduced_table$specificEpithet, "]", " ", #
  "[Bio_material=", reduced_table$otherCatalogNumbers, "]", " ", "[Specimen-voucher=", #
  reduced_table$institutionCode, ":", reduced_table$catalogNumber, "]", " ", "[location=mitochondrion] [mgcode=2]")
fasta_complete <- paste(fasta_description, reduced_table$nucleotides_CYTB, sep="\n")# add data to fasta
write(fasta_complete, file="sequences.fsa", append=FALSE)# write out the fasta file

## read_reduce.R
tab <- read.table("master.tsv", header=TRUE, sep="\t", stringsAsFactors=FALSE)
reduced_table <- tab[-which(is.na(tab$nucleotides_CYTB)), ]

## master_fake.tsv
otherCatalogNumbers	genus	specificEpithet	institutionCode	catalogNumber	country	nucleotides_CYTB	nucleotides_16S
BB-001			Boops	boops		MNHN		1978-0632	Spain	NA			TATGGAGCTTAA
BB-002			Boops	boops		MNHN		1978-0632	Spain	ATGGCTAGCCT		NA
BB-003			Boops	boops		MNHN		1978-0632	Spain	ATGGCTAGCCT		TATGGAGCTTAA
	feature_tab <- paste0(paste0(">Feature", " ", reduced_table$otherCatalogNumbers, "_", gene_name),"\n", #
	"1", "\t", ">", nchar(reduced_table$nucleotides_CYTB), "\t", "gene", "\n", #
	"\t", "\t", "\t", "gene", "\t", gene_name, "\n", #
	"1", "\t", ">", nchar(reduced_table$nucleotides_CYTB), "\t", "CDS", "\t", "\t", "\n", #
	"\t", "\t", "\t", "product", "\t", prod_name, "\n", #
	"\t", "\t", "\t", "codon_start", "\t", "1")
	write(feature_tab, file="features.tbl", append=FALSE)# write out
	fasta_description <- paste0(">", paste0(reduced_table$otherCatalogNumbers, "_", gene_name), " ", #
	"[organism=", reduced_table$genus, " ", reduced_table$specificEpithet, "]", " ", #
	"[Bio_material=", reduced_table$otherCatalogNumbers, "]", " ", "[Specimen-voucher=", #
	reduced_table$institutionCode, ":", reduced_table$catalogNumber, "]", " ", "[location=mitochondrion] [mgcode=2]")
	fasta_complete <- paste(fasta_description, reduced_table$nucleotides_CYTB, sep="\n")# add data to fasta
	write(fasta_complete, file="sequences.fsa", append=FALSE)# write out the fasta file
	tab <- read.table("master.tsv", header=TRUE, sep="\t", stringsAsFactors=FALSE)
	reduced_table <- tab[-which(is.na(tab$nucleotides_CYTB)), ]
	otherCatalogNumbers genus specificEpithet institutionCode catalogNumber country nucleotides_CYTB nucleotides_16S
	BB-001 Boops boops MNHN 1978-0632 Spain NA TATGGAGCTTAA
	BB-002 Boops boops MNHN 1978-0632 Spain ATGGCTAGCCT NA
	BB-003 Boops boops MNHN 1978-0632 Spain ATGGCTAGCCT TATGGAGCTTAA