seanie12/config.py

## config.py
# old files
train_src_file = "./squad/para-train.txt"
train_trg_file = "./squad/tgt-train.txt"
dev_src_file = "./squad/para-dev.txt"
dev_trg_file = "./squad/tgt-dev.txt"
test_src_file = "./squad/para-test.txt"
test_trg_file = "./squad/tgt-test.txt"
embedding = "./data/embedding.pkl"
word2idx_file = "./data/word2idx.pkl"

# files
squad_train_file = "./squad/train-v1.1.json"
squad_dev_file = "./squad/new_dev-v1.1.json"
squad_test_file = "./squad/new_test-v1.1.json"
new_squad_file = "./squad/bert-gumbel-generated_test-v1.1.json"

qa_path = "./save/siamese_qa/train_524100110/bert_6_78.324"
qg_path = "./save/bert-qg/train_518172705/6_2.42"
c2q_path = "./save/c2q/qg_no_ans/16_3.0"
c2a_path = "./save/c2a/gumbel/1_3.4"


# model_path = "./save/dual/train_506144932/1_2.890"
model_path = "./save/bert-qg/best/8_2.39"
train = False
device = "cuda:3"
use_gpu = True
debug = False
reduce_size = False
augment = False
ratio = 1.0
vocab_size = 30522

num_epochs = 20
max_length = 400
max_seq_len = 384
max_query_len = 64
num_layers = 2
hidden_size = 300
embedding_size = 768

# bert config
bert_model = "bert-base-uncased"
bert_layers = [-1]
freeze_bert = False

# QA config
qa_lr = 5e-5
gradient_accumulation_steps = 8
warmup_proportion = 0.1
qa_lambda = 1.0
qg_lambda = 1.0

tau = 1.0
lr = 0.1
batch_size = 4
dropout = 0.3
max_grad_norm = 5.0

use_tag = False
use_pointer = True
beam_size = 10
min_decode_step = 8
max_decode_step = 40
output_dir = "./result/best_qg"
	# old files
	train_src_file = "./squad/para-train.txt"
	train_trg_file = "./squad/tgt-train.txt"
	dev_src_file = "./squad/para-dev.txt"
	dev_trg_file = "./squad/tgt-dev.txt"
	test_src_file = "./squad/para-test.txt"
	test_trg_file = "./squad/tgt-test.txt"
	embedding = "./data/embedding.pkl"
	word2idx_file = "./data/word2idx.pkl"

	# files
	squad_train_file = "./squad/train-v1.1.json"
	squad_dev_file = "./squad/new_dev-v1.1.json"
	squad_test_file = "./squad/new_test-v1.1.json"
	new_squad_file = "./squad/bert-gumbel-generated_test-v1.1.json"

	qa_path = "./save/siamese_qa/train_524100110/bert_6_78.324"
	qg_path = "./save/bert-qg/train_518172705/6_2.42"
	c2q_path = "./save/c2q/qg_no_ans/16_3.0"
	c2a_path = "./save/c2a/gumbel/1_3.4"


	# model_path = "./save/dual/train_506144932/1_2.890"
	model_path = "./save/bert-qg/best/8_2.39"
	train = False
	device = "cuda:3"
	use_gpu = True
	debug = False
	reduce_size = False
	augment = False
	ratio = 1.0
	vocab_size = 30522

	num_epochs = 20
	max_length = 400
	max_seq_len = 384
	max_query_len = 64
	num_layers = 2
	hidden_size = 300
	embedding_size = 768

	# bert config
	bert_model = "bert-base-uncased"
	bert_layers = [-1]
	freeze_bert = False

	# QA config
	qa_lr = 5e-5
	gradient_accumulation_steps = 8
	warmup_proportion = 0.1
	qa_lambda = 1.0
	qg_lambda = 1.0

	tau = 1.0
	lr = 0.1
	batch_size = 4
	dropout = 0.3
	max_grad_norm = 5.0

	use_tag = False
	use_pointer = True
	beam_size = 10
	min_decode_step = 8
	max_decode_step = 40
	output_dir = "./result/best_qg"