venkan/metadata_for_TCGA.r

## metadata_for_TCGA.r
library(GenomicDataCommons)
q = files() %>%
  filter(~ cases.project.project_id == 'TCGA-LIHC' &
           data_type == 'Aligned Reads' &
           experimental_strategy == 'WXS' &
           data_format == 'BAM') %>% select('file_id') %>%
  expand('analysis.metadata.read_groups')
file_ids = ids(q)
z = results_all(q)
read_length_list = sapply(z$analysis$metadata$read_groups,'[[','read_length')

library(dplyr)
#h <- z$analysis$metadata$read_groups %>% bind_rows() %>% as_tibble()
rg_info = bind_rows(z$analysis$metadata$read_groups)
write.csv(rg_info, "TCGA-LIHC_read_length.csv", row.names= FALSE)
	library(GenomicDataCommons)
	q = files() %>%
	filter(~ cases.project.project_id == 'TCGA-LIHC' &
	data_type == 'Aligned Reads' &
	experimental_strategy == 'WXS' &
	data_format == 'BAM') %>% select('file_id') %>%
	expand('analysis.metadata.read_groups')
	file_ids = ids(q)
	z = results_all(q)
	read_length_list = sapply(z$analysis$metadata$read_groups,'[[','read_length')

	library(dplyr)
	#h <- z$analysis$metadata$read_groups %>% bind_rows() %>% as_tibble()
	rg_info = bind_rows(z$analysis$metadata$read_groups)
	write.csv(rg_info, "TCGA-LIHC_read_length.csv", row.names= FALSE)