Skip to content

Instantly share code, notes, and snippets.

@arraytools
Last active February 14, 2023 01:51
Show Gist options
  • Star 0 You must be signed in to star a gist
  • Fork 0 You must be signed in to fork a gist
  • Save arraytools/7e175795ec62ec940e0fcee8795dcce2 to your computer and use it in GitHub Desktop.
Save arraytools/7e175795ec62ec940e0fcee8795dcce2 to your computer and use it in GitHub Desktop.
Epithelial and mesenchymal gene signatures from Tan et al. 2014 . ‘Table S1B. Generic EMT signature for cell line’ & 'Table S1A. Generic EMT signature for tumour'. See also https://bioconductor.org/packages/release/bioc/vignettes/singscore/inst/doc/singscore.html#22_Sample_scoring_with_a_reduced_number_of_measurements
x <- readxl::read_excel("~/Downloads/EMset.xlsx")
x %>% drop_na() %>% write.table("~/Downloads/EMset.txt", quote=F, row.names = F)
x2 <- read.table("~/Downloads/EMset.txt")
dim(x2) # 218 x 2
epi <- x2[1:170, 2]
mes <- x2[171:218, 2]
x3 <- data.frame(symbol=x2[,2], epimes=c(rep("epi", 170), rep("mes", 48)))
x3[, 1] <- gsub(substr(x3[1,1], 1, 1), "", x3[,1]) # rm "white space'?
write.table(x3, file="~/Downloads/EMgenes_cellline.txt", quote=F, row.names = F, sep="\t")
symbol epimes
CDH1 epi
AGR2 epi
EPCAM epi
KRT19 epi
RAB25 epi
TACSTD2 epi
S100P epi
CEACAM6 epi
GALNT3 epi
FXYD3 epi
SPINT2 epi
TMEM30B epi
SCNN1A epi
ST14 epi
ESRP1 epi
S100A14 epi
CLDN7 epi
ERBB3 epi
RBM47 epi
SPINT1 epi
ELF3 epi
CLDN4 epi
PRSS8 epi
SH3YL1 epi
EHF epi
LCN2 epi
JUP epi
VAMP8 epi
KRT8 epi
C1orf106 epi
KRT7 epi
DSP epi
CDS1 epi
ITGB4 epi
TMPRSS4 epi
LSR epi
SORL1 epi
GRHL2 epi
PPL epi
C1orf116 epi
TSPAN1 epi
MAP7 epi
SLPI epi
TOX3 epi
ARHGAP8 epi
F11R epi
LAD1 epi
GPX2 epi
CTSH epi
GPR56 epi
FA2H epi
KLF5 epi
AREG epi
KRT18 epi
SCEL epi
CDH3 epi
UGT1A1 epi
MPZL2 epi
AIM1 epi
OVOL2 epi
LLGL2 epi
ESRP2 epi
MYO5C epi
DDR1 epi
VGLL1 epi
IRF6 epi
SFN epi
TSPAN13 epi
KCNK1 epi
MYO1D epi
PKP3 epi
ITGB6 epi
LY75 epi
MAPK13 epi
TTC39A epi
ELMO3 epi
CEACAM1 epi
DTX4 epi
ERBB2 epi
RAB11FIP1 epi
ATP2C2 epi
MST1R epi
AP1M2 epi
TGFA epi
MYO6 epi
PTK6 epi
OAS1 epi
FBP1 epi
AQP3 epi
CBLC epi
EPHA1 epi
BSPRY epi
SH2D3A epi
EPS8L1 epi
GRB7 epi
C4orf19 epi
KLK6 epi
TJP2 epi
PLS1 epi
DENND2D epi
EPS8L2 epi
IL20RA epi
HES1 epi
IL1RN epi
EXPH5 epi
ARHGDIB epi
C19orf21 epi
CAMK2N1 epi
HPGD epi
SYNGR2 epi
C10orf116 epi
PERP epi
MANSC1 epi
DSC2 epi
POF1B epi
SERINC5 epi
BIK epi
ANXA9 epi
MALL epi
EPN3 epi
STAP2 epi
FOXA1 epi
PYCARD epi
ZNF165 epi
SLC37A1 epi
ANK3 epi
TSPAN15 epi
HNMT epi
ABCC3 epi
SDC1 epi
CKMT1A epi
TOB1 epi
B3GNT3 epi
TMC6 epi
CD9 epi
ADAP1 epi
ATP1B1 epi
SHANK2 epi
CYB561 epi
ERMP1 epi
RAB20 epi
MYH14 epi
CAPN1 epi
ALDH3B2 epi
TRIM31 epi
ARAP2 epi
SSH3 epi
ICA1 epi
ARHGEF5 epi
ALOX5 epi
RHOD epi
TMPRSS2 epi
MTUS1 epi
CYP4F3 epi
PPFIBP2 epi
RABGAP1L epi
PLXNB2 epi
MGST2 epi
OR7E14P epi
EVPL epi
CD46 epi
KRT15 epi
CNKSR1 epi
BLNK epi
COMT epi
ANXA4 epi
TNFSF13 epi
OCLN epi
SLC9A3R1 epi
XBP1 epi
VIM mes
ZEB1 mes
EMP3 mes
SACS mes
AXL mes
LOXL2 mes
SPARC mes
FHL1 mes
FERMT2 mes
TUBA1A mes
TMEM158 mes
CALD1 mes
LGALS1 mes
PMP22 mes
MSN mes
GLYR1 mes
MAP1B mes
AP1S2 mes
GJA1 mes
DENND5A mes
C12orf24 mes
TPM2 mes
TUBB6 mes
SRPX mes
ANK2 mes
CHN1 mes
SH2B3 mes
LEPRE1 mes
ETV1 mes
SOBP mes
AKAP12 mes
TGFB1I1 mes
SERPINE1 mes
SOAT1 mes
COL5A2 mes
LHFP mes
CEP170 mes
POPDC3 mes
TRPC1 mes
KDELC1 mes
MYL9 mes
BAG2 mes
FSTL1 mes
MXRA7 mes
GFPT2 mes
RECK mes
TMEFF1 mes
PTRF mes
gene epimes
KRT19 epi
AGR2 epi
RAB25 epi
CDH1 epi
ERBB3 epi
FXYD3 epi
SLC44A4 epi
S100P epi
SCNN1A epi
GALNT3 epi
PRSS8 epi
ELF3 epi
CEACAM6 epi
TMPRSS4 epi
CLDN7 epi
TACSTD2 epi
CLDN3 epi
EPCAM epi
SPINT1 epi
TSPAN1 epi
PLS1 epi
TMEM30B epi
PRR15L epi
KRT8 epi
ST14 epi
RBM47 epi
S100A14 epi
C1orf106 epi
NQO1 epi
TOX3 epi
PTK6 epi
TFF1 epi
CLDN4 epi
KRT18 epi
PPAP2C epi
CEACAM7 epi
TTC39A epi
AP1M2 epi
CEACAM5 epi
LAD1 epi
ARHGAP8 epi
TFF3 epi
JUP epi
MLPH epi
ERBB2 epi
LLGL2 epi
DDR1 epi
FA2H epi
TMPRSS2 epi
LSR epi
MYO5C epi
RAB11FIP1 epi
MAPK13 epi
CEACAM1 epi
CXADR epi
MPZL2 epi
EPS8L1 epi
GALNT7 epi
CORO2A epi
TPD52 epi
ARHGAP32 epi
OR7E14P epi
GALE epi
RAPGEFL1 epi
STYK1 epi
F11R epi
TJP2 epi
FGFR3 epi
FUT3 epi
TOM1L1 epi
IRF6 epi
EPB41L4B epi
SPDEF epi
OCLN epi
LRRC1 epi
C19orf21 epi
EPS8L2 epi
MYO6 epi
MST1R epi
SLC16A5 epi
TRPM4 epi
PHLDA2 epi
VAV3 epi
SPAG1 epi
ABCC3 epi
SYNGR2 epi
STAP2 epi
C4orf19 epi
HDHD3 epi
CD2AP epi
SDC4 epi
FAM174B epi
PTPRF epi
SORD epi
GPRC5A epi
MAP7 epi
OVOL2 epi
CD24 epi
ELMO3 epi
CBLC epi
PERP epi
KRT7 epi
ATP2C2 epi
BCAS1 epi
FUT2 epi
GRHL2 epi
PKP3 epi
BSPRY epi
ABHD11 epi
TSPAN8 epi
GPR56 epi
VAMP8 epi
PPL epi
MANSC1 epi
IL20RA epi
TJP3 epi
CKMT1A epi
EHF epi
TMC5 epi
POF1B epi
RNF128 epi
BIK epi
CYB561 epi
AZGP1 epi
SLC22A18 epi
PLLP epi
DHCR24 epi
ESRP1 epi
SH3YL1 epi
TOB1 epi
AKR1B10 epi
DSG2 epi
EPN3 epi
MUC1 epi
GDF15 epi
SLC35A3 epi
TUFT1 epi
SPINT2 epi
PSCA epi
GMDS epi
ESRP2 epi
EZR epi
EXPH5 epi
CDS1 epi
DSP epi
GAS1 mes
FHL1 mes
FYN mes
WIPF1 mes
CYP1B1 mes
SERPING1 mes
VCAM1 mes
MAP1B mes
SRPX mes
EMP3 mes
C1R mes
FBN1 mes
FN1 mes
FXYD6 mes
IGF1 mes
NAP1L3 mes
QKI mes
MS4A4A mes
DCN mes
EFEMP1 mes
RARRES2 mes
PLEKHO1 mes
CHRDL1 mes
DDR2 mes
DSE mes
AKT3 mes
COL6A2 mes
DPYSL3 mes
CCL2 mes
MAFB mes
MFAP4 mes
MAF mes
KCNJ8 mes
AKAP12 mes
COL14A1 mes
AXL mes
ECM2 mes
MYL9 mes
OLFML3 mes
CLIC4 mes
ENPP2 mes
SAMSN1 mes
COL6A1 mes
IGFBP5 mes
SLC2A3 mes
OLFML2B mes
ANGPTL2 mes
PCOLCE mes
COLEC12 mes
TNS1 mes
CLEC2B mes
6-Sep mes
FGL2 mes
MS4A6A mes
PTRF mes
GFPT2 mes
CXCR4 mes
SPOCK1 mes
SNAI2 mes
PLXNC1 mes
SYT11 mes
MYH10 mes
CSF2RB mes
TNC mes
PMP22 mes
CAV1 mes
CDK14 mes
SDC2 mes
NR3C1 mes
SYNM mes
WWTR1 mes
FBLN1 mes
MPDZ mes
EFEMP2 mes
GIMAP6 mes
COL15A1 mes
CRISPLD2 mes
PDGFC mes
GEM mes
GZMK mes
SPARCL1 mes
MEOX2 mes
CXCL12 mes
FERMT2 mes
SERPINF1 mes
TCF4 mes
DPT mes
MRC1 mes
LOX mes
PTPRC mes
RGS2 mes
TUBA1A mes
SACS mes
CDH11 mes
SFRP1 mes
UCHL1 mes
EVI2A mes
FSTL1 mes
STON1 mes
TPM2 mes
MOXD1 mes
CTSK mes
JAM3 mes
GREM1 mes
GIMAP4 mes
LHFP mes
SPARC mes
GUCY1B3 mes
FLI1 mes
COL5A2 mes
PTGDS mes
FAP mes
SYNE1 mes
KIAA1462 mes
CHN1 mes
ISLR mes
BNC2 mes
ITM2A mes
ZEB1 mes
C1S mes
CALD1 mes
RECK mes
F13A1 mes
AP1S2 mes
GLIPR1 mes
PDZRN3 mes
C14orf139 mes
TUBB6 mes
PLN mes
SLIT2 mes
ASPN mes
AKAP2 mes
TAGLN mes
VCAN mes
TWIST1 mes
VSIG4 mes
MMP2 mes
NUAK1 mes
CCL8 mes
BGN mes
IFFO1 mes
GLYR1 mes
PTGIS mes
ANK2 mes
JAM2 mes
MYLK mes
CXCL13 mes
ZEB2 mes
SRGN mes
BICC1 mes
CDH2 mes
ZCCHC24 mes
GPM6B mes
GNG11 mes
VIM mes
LY96 mes
FLRT2 mes
HEG1 mes
SOBP mes
IL10RA mes
CRYAB mes
TRPC1 mes
CD163 mes
ZFPM2 mes
PTX3 mes
C1orf54 mes
SFRP4 mes
CSRP2 mes
CEP170 mes
RUNX1T1 mes
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment