Skip to content

Instantly share code, notes, and snippets.

@hanzou666
hanzou666 / GFA_for_vg.md
Last active November 14, 2019 15:02
GFAの説明

GFA (Graphical Fragment Assembly)

もとはゲノムアセンブリで使われ出したタブ区切りのテキストファイル。
ノードが塩基配列、エッジがノードのリンクを表すように設計されている。1列目のタグで判定する。

ここでは、GFAのバージョン1.0で、かつvg viewが認識することができる表現についてのみ述べることにする。 Pの表現方法が、vgのバージョンによって若干異なるのでそこも注意しなければならない(v1.5.0だと、GFA-spec 1.0 と同じように考えればよい。v1.6については未確認)。

タグ一覧

@hanzou666
hanzou666 / get_complete_genome.sh
Last active March 20, 2018 09:11
Download complete genome from RefSeq database
#!/bin/bash
# example: get_complete_genome.sh "Bifidobacterium longum"
wget ftp://ftp.ncbi.nlm.nih.gov/genomes/ASSEMBLY_REPORTS/assembly_summary_refseq.txt
for i in `grep $1 ../assembly_summary_refseq.txt|grep "Complete Genome"|awk -F "\t" '{print $(NF-2)}'`
do
a=`echo $i|awk -F "/" '{print $NF}'`
wget ${i}/${a}_genomic.fna.gz
done
date > download_log.txt
@hanzou666
hanzou666 / checkm.md
Last active December 18, 2018 06:16
(メタ)ゲノム解析に用いる配列処理ツールの説明
@hanzou666
hanzou666 / alignment.py
Last active July 14, 2019 17:26
Pair-wise alignment algorithm for comparison of two genome sequences
#!/usr/bin/env python3
# coding: utf-8
"""
Pair-wise alignment algorithm for comparison of two genome sequences
usage: python3 alignment.py
"""
from abc import ABCMeta, abstractmethod
#!/usr/bin/env python3
# coding: utf-8
"""
GFFを読み込んで、GFAの座標に合わせたCSVファイルに変換する
"""
import argparse
from queue import deque
@hanzou666
hanzou666 / aug.inv.gfa
Last active March 30, 2020 13:40
augmentのテスト
H VN:Z:1.0
S 5 TGC
S 7 CCCCCCCCCC
S 1 ATGTC
S 4 AGTCC
S 6 TTC
S 2 CA
S 3 AG
P 1 1+,2+,5+,3+,6+,4+ 5M,2M,3M,2M,3M,5M
L 1 + 2 + 0M