Optimize_Transformer_Moder_Experiment

Experiment difference optimization method The model experiment is the intents predictions use BERT base model fine tune tin CLINC150 dataset ( have 150 intents labels in 10 domains) Techniques to speed up the predictions and reduce the memory footprint include

Quantization
knowledge distillation
quantization training
pruning
graph optimization ( with ONNX and ORT)

Name		Name	Last commit message	Last commit date
Latest commit History 8 Commits
__pycache__		__pycache__
.gitignore		.gitignore
Distillation.py		Distillation.py
README.md		README.md
accelerate_experiment.ipynb		accelerate_experiment.ipynb
experiment_bitandbytes_lib.ipynb		experiment_bitandbytes_lib.ipynb
experiment_distillation.ipynb		experiment_distillation.ipynb
experiment_quantization_and_ORT.ipynb		experiment_quantization_and_ORT.ipynb
experiment_transformer_efficient.ipynb		experiment_transformer_efficient.ipynb
requirements.txt		requirements.txt
utils.py		utils.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Optimize_Transformer_Moder_Experiment

About

Releases

Packages

Languages

Nghiauet/Optimize_Transformer_Moder_Experiment

Folders and files

Latest commit

History

Repository files navigation

Optimize_Transformer_Moder_Experiment

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages