ArthurZucker/mamba_peft.py

## mamba_peft.py
from datasets import load_dataset
from trl import SFTTrainer
from peft import LoraConfig
from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments
tokenizer = AutoTokenizer.from_pretrained("state-spaces/mamba-130m-hf")
model = AutoModelForCausalLM.from_pretrained("state-spaces/mamba-130m-hf")
dataset = load_dataset("Abirate/english_quotes", split="train")
training_args = TrainingArguments(
    output_dir="./results",
    num_train_epochs=3,
    per_device_train_batch_size=4,
    logging_dir='./logs',
    logging_steps=10,
    learning_rate=2e-3
)
lora_config =  LoraConfig(
        r=8,
        target_modules=["x_proj", "embeddings", "in_proj", "out_proj"],
        task_type="CAUSAL_LM",
        bias="none"
)
trainer = SFTTrainer(
    model=model,
    tokenizer=tokenizer,
    args=training_args,
    peft_config=lora_config,
    train_dataset=dataset,
    dataset_text_field="quote",
)
trainer.train()
	from datasets import load_dataset
	from trl import SFTTrainer
	from peft import LoraConfig
	from transformers import AutoTokenizer, AutoModelForCausalLM, TrainingArguments
	tokenizer = AutoTokenizer.from_pretrained("state-spaces/mamba-130m-hf")
	model = AutoModelForCausalLM.from_pretrained("state-spaces/mamba-130m-hf")
	dataset = load_dataset("Abirate/english_quotes", split="train")
	training_args = TrainingArguments(
	output_dir="./results",
	num_train_epochs=3,
	per_device_train_batch_size=4,
	logging_dir='./logs',
	logging_steps=10,
	learning_rate=2e-3
	)
	lora_config = LoraConfig(
	r=8,
	target_modules=["x_proj", "embeddings", "in_proj", "out_proj"],
	task_type="CAUSAL_LM",
	bias="none"
	)
	trainer = SFTTrainer(
	model=model,
	tokenizer=tokenizer,
	args=training_args,
	peft_config=lora_config,
	train_dataset=dataset,
	dataset_text_field="quote",
	)
	trainer.train()