Sung Kim sungkim11

## parallel_t5.py
from transformers import AutoTokenizer, T5ForConditionalGeneration

# Model Init
n_gpu = 8
tokenizer = AutoTokenizer.from_pretrained("google/flan-ul2")
model = T5ForConditionalGeneration.from_pretrained("google/flan-ul2")
heads_per_gpu = len(model.encoder.block) // n_gpu
device_map = {
    gpu: list(
        range(
	from transformers import AutoTokenizer, T5ForConditionalGeneration

	# Model Init
	n_gpu = 8
	tokenizer = AutoTokenizer.from_pretrained("google/flan-ul2")
	model = T5ForConditionalGeneration.from_pretrained("google/flan-ul2")
	heads_per_gpu = len(model.encoder.block) // n_gpu
	device_map = {
	gpu: list(
	range(