jackkamm/download_assembly_db.py

## download_assembly_db.py
import os
import urllib
import xml.etree.ElementTree as ET

from Bio import Entrez
Entrez.email = "jack.kamm@czbiohub.org"

uid = ET.parse(Entrez.esearch(db="assembly", term="GCA_000150765.1")).getroot().find("IdList")[0].text
ftp_path = ET.parse(Entrez.esummary(db="assembly", id=uid)).getroot().find("DocumentSummarySet").find("DocumentSummary").find("FtpPath_GenBank").text
basename = os.path.basename(ftp_path)
fasta_path = os.path.join(ftp_path, basename + "_genomic.fna.gz")
urllib.request.urlretrieve(fasta_path, os.path.basename(fasta_path))
	import os
	import urllib
	import xml.etree.ElementTree as ET

	from Bio import Entrez
	Entrez.email = "jack.kamm@czbiohub.org"

	uid = ET.parse(Entrez.esearch(db="assembly", term="GCA_000150765.1")).getroot().find("IdList")[0].text
	ftp_path = ET.parse(Entrez.esummary(db="assembly", id=uid)).getroot().find("DocumentSummarySet").find("DocumentSummary").find("FtpPath_GenBank").text
	basename = os.path.basename(ftp_path)
	fasta_path = os.path.join(ftp_path, basename + "_genomic.fna.gz")
	urllib.request.urlretrieve(fasta_path, os.path.basename(fasta_path))