fix(llama.cpp): set better defaults for llama.cpp (#1961)

fix(defaults): set better defaults for llama.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io>
2025-05-20 02:24:59 +00:00 · 2024-04-06 22:56:45 +02:00 · 2024-04-06 22:56:45 +02:00 · 8342553214
commit 8342553214
parent 8aa5f5a660
4 changed files with 23 additions and 12 deletions
--- a/core/config/backend_config.go
+++ b/core/config/backend_config.go
@ -205,13 +205,16 @@ func (cfg *BackendConfig) SetDefaults(opts ...ConfigLoaderOption) {
 	threads := lo.threads
 	f16 := lo.f16
 	debug := lo.debug
-	defaultTopP := 0.7
-	defaultTopK := 80
+	// https://github.com/ggerganov/llama.cpp/blob/75cd4c77292034ecec587ecb401366f57338f7c0/common/sampling.h#L22
+	defaultTopP := 0.95
+	defaultTopK := 40
 	defaultTemp := 0.9
 	defaultMaxTokens := 2048
 	defaultMirostat := 2
 	defaultMirostatTAU := 5.0
 	defaultMirostatETA := 0.1
+	defaultTypicalP := 1.0
+	defaultTFZ := 1.0

 	// Try to offload all GPU layers (if GPU is found)
 	defaultNGPULayers := 99999999
@ -229,6 +232,14 @@ func (cfg *BackendConfig) SetDefaults(opts ...ConfigLoaderOption) {
 		cfg.TopK = &defaultTopK
 	}

+	if cfg.TypicalP == nil {
+		cfg.TypicalP = &defaultTypicalP
+	}
+
+	if cfg.TFZ == nil {
+		cfg.TFZ = &defaultTFZ
+	}
+
 	if cfg.MMap == nil {
 		// MMap is enabled by default
 		cfg.MMap = &trueV