Skip to content

Instantly share code, notes, and snippets.

View geocarvalho's full-sized avatar
🐼

George Carvalho geocarvalho

🐼
View GitHub Profile
@geocarvalho
geocarvalho / CHANGELOG.md
Created June 9, 2023 22:23 — forked from juampynr/CHANGELOG.md
Sample CHANGELOG

Change Log

All notable changes to this project will be documented in this file.

The format is based on Keep a Changelog and this project adheres to Semantic Versioning.

[Unreleased] - yyyy-mm-dd

Here we write upgrading notes for brands. It's a team effort to make them as

@geocarvalho
geocarvalho / awesome_bioinformatics.md
Last active March 24, 2023 23:27
Learn clinical bioinformatics: List of my recommendations to study genomics bioinformatics and clinical bioinformatics

Learn Clinical Bioinformatics 📚

  • My personal list of recommendations of resources to study genomics bioinformatics and clinical bioinformatics

Courses

  • This is just the best open source course I could find until now.
import pandas as pd
file = "input.bed"
df = pd.read_csv(file, sep="\t", names=["chr", "start", "end", "interval", "score", "strand"])
df[["gene", "extra"]] = df["interval"].str.split("_", 1, expand=True)
df.drop(["interval", "score", "strand", "extra"], axis=1, inplace=True)
new_df = df.groupby("gene").agg({"chr":"unique", "start":min, "end":max})
new_df.reset_index(inplace=True)
new_df["chr"] = new_df["chr"].apply(lambda chr: chr[0])
new_df["start"] = new_df["start"].astype("str")
@geocarvalho
geocarvalho / liftover_bed.py
Last active July 26, 2023 17:06
(up) need to add other columns
#!/usr/bin/python3
from pyliftover import LiftOver
import pandas as pd
import argparse
import mapply
import sys
import os
mapply.init(
@geocarvalho
geocarvalho / code_cnv_bed.md
Created April 15, 2019 16:01
Commands to create bed inputs for exomedepth and devicnv using normal bed

Exomedepth:

$ awk -F"__" '$1=$1' OFS="\t" PAHC44_1_CDHS-17427Z-2274_sorted.bed | cut -f1,2,3,4 > qiaseq_PAHC44_1_CDHS-17427Z-2274_no_header.bed

DeviCNV:

$ echo -e "Amplicon_ID\tChr\tAmplicon_Start\tAmplicon_End\tInsert_Start\tInsert_End\tGene\tTranscript\tExon\tPool" > qiaseq_PAHC44_1_CDHS-17427Z-2274_no_header.devicnv.bed $ awk -F"__" '$1=$1' OFS="\t" PAHC44_1_CDHS-17427Z-2274_sorted.bed | awk '{ print $4"."$7"\t"$1"\t"$2"\t"$3"\t"$2"\t"$3"\t"$4"\t"$4"\t"$7"\t"Pool1}' >> qiaseq_PAHC44_1_CDHS-17427Z-2274_no_header.devicnv.bed

@geocarvalho
geocarvalho / learn_git_branching.md
Created July 1, 2018 22:03
Learn_git_branching

Introdução aos commits no Git

  • Um commit em um repositório git registra uma fotografia (snapshot) de todos os arquivos no seu diretório. É como um grande copy&paste, mas ainda melhor!
  • O Git tem por objetivo manter os commits tão leves quanto possível, de forma que ele não copia cegamente o diretório completo toda vez que você commita. Ele pode (quando possível) comprimir um commit como um conjunto de mudanças (ou um "delta") entre uma versão do seu repositório e a seguinte.
  • O Git também mantém um histórico de quando ocorreu cada commit. É por isso que a maioria dos commits tem ancestrais acima de si -- que indicamos usando setas na nossa visualização. Manter a história é ótimo para todos que trabalham no projeto!
  • Há muito para aprender, mas por enquanto pense nos commits como snapshots do seu projeto. Os commits são muito leves, e mudar de um para outro é extremamente rápido!
  • Vejamos o que isso significa na prática. Abaixo, temos uma vis