OneOS/Trainer at master · wasertech/OneOS

History

Name		Name	Last commit message	Last commit date
parent directory ..
Dockerfile.train		Dockerfile.train
README.md		README.md
awquant.py		awquant.py
checks.sh		checks.sh
dpo.sh		dpo.sh
dpo_train.py		dpo_train.py
eval_prompt.py		eval_prompt.py
export.sh		export.sh
merge_lora_adapter.py		merge_lora_adapter.py
print_gpus.py		print_gpus.py
publish.sh		publish.sh
push_model.py		push_model.py
quantize.sh		quantize.sh
requirements.txt		requirements.txt
run.sh		run.sh
sft_train.py		sft_train.py
train.sh		train.sh

README.md

Build and start training using docker.

docker build \
--rm \
--build-arg uid=1018 \
--build-arg gid=1018 \
-f Dockerfile.train \
-t llm-train:latest . && \
docker run \
-it \
--env HUB_API_TOKEN="${HUB_API_TOKEN}" \
--env PUSH_TO_HUB=0 \
--env LOG_TO_WANDB=1 \
--env DISTRIBUTE_TRAIN=1 \
--env NPROC_PER_GPU=2 \
--env BASE_MODEL_NAME="cognitivecomputations/dolphin-2.2.1-mistral-7b" \
--env OUTPUT_MODEL_NAME="assistant-mistral-7b-dolphin-2.2.1" \
--env BATCH_SIZE=4 \
--env GAS=4 \
--env SEQENCE_LENGTH=4096 \
--env USE_PEFT=1 \
--env USE_4BIT=1 \
--gpus=all \
--privileged \
--shm-size=1g \
--ulimit memlock=-1 \
--ulimit stack=67108864 \
--mount type=bind,src=`echo ~/.cache/huggingface/`,dst=/home/trainer/.cache/huggingface/ \
--mount type=bind,src="${DATA_VOLUME_PATH}",dst=/mnt \
llm-train:latest && \
docker container prune || docker container prune -f

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Trainer

Trainer

README.md

Files

Trainer

Directory actions

More options

Directory actions

More options

Latest commit

History

Trainer

Folders and files

parent directory

README.md