* models(gallery): add higher quants for some llama and hermes
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
* models(gallery): vllm: specify a reasonable max_tokens
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
---------
Signed-off-by: Ettore Di Giacinto <mudler@localai.io>