GitHub / InseeFrLab / auto-tuning-vllm
Auto-tuning for vllm. Getting the best performance out of your LLM deployment (vllm+guidellm+optuna)
JSON API: https://ecosystem.code.gouv.fr/api/v1/hosts/GitHub/repositories/InseeFrLab%2Fauto-tuning-vllm
étoiles: 3
forks: 0
issues ouvertes: 15
licence: apache-2.0
langage: Python
taille: 2,93 Mo
dépendances analysées: En attente
date de création: il y a 3 mois
date de mise à jour: il y a 14 jours
enregistré: il y a 9 jours
dernière synchronisation: il y a 5 jours
Readme
Loading...