feat: add experimental support for falcon-7b (#516)

Signed-off-by: mudler <mudler@mocaccino.org>
2025-05-20 02:24:59 +00:00 · 2023-06-06 17:23:19 +02:00 · 2023-06-06 17:23:19 +02:00 · d62aef2016
commit d62aef2016
parent 25e9483add
4 changed files with 36 additions and 4 deletions
--- a/pkg/model/initializers.go
+++ b/pkg/model/initializers.go
@ -34,6 +34,7 @@ const (
 	Gpt4AllMptBackend      = "gpt4all-mpt"
 	Gpt4AllJBackend        = "gpt4all-j"
 	Gpt4All                = "gpt4all"
+	FalconBackend          = "falcon"
 	BertEmbeddingsBackend  = "bert-embeddings"
 	RwkvBackend            = "rwkv"
 	WhisperBackend         = "whisper"
@ -41,7 +42,7 @@ const (
 	LCHuggingFaceBackend   = "langchain-huggingface"
 )

-var backends []string = []string{
+var autoLoadBackends []string = []string{
 	LlamaBackend,
 	Gpt4All,
 	RwkvBackend,
@ -51,6 +52,7 @@ var backends []string = []string{
 	GPTJBackend,
 	Gpt2Backend,
 	DollyBackend,
+	FalconBackend,
 	MPTBackend,
 	ReplitBackend,
 	StarcoderBackend,
@ -81,6 +83,10 @@ var gptJ = func(modelFile string) (interface{}, error) {
 	return transformers.NewGPTJ(modelFile)
 }

+var falcon = func(modelFile string) (interface{}, error) {
+	return transformers.NewFalcon(modelFile)
+}
+
 var bertEmbeddings = func(modelFile string) (interface{}, error) {
 	return bert.New(modelFile)
 }
@ -144,6 +150,8 @@ func (ml *ModelLoader) BackendLoader(backendString string, modelFile string, lla
 		return ml.LoadModel(modelFile, mpt)
 	case Gpt2Backend:
 		return ml.LoadModel(modelFile, transformersLM)
+	case FalconBackend:
+		return ml.LoadModel(modelFile, falcon)
 	case GPTNeoXBackend:
 		return ml.LoadModel(modelFile, gptNeoX)
 	case ReplitBackend:
@ -180,7 +188,7 @@ func (ml *ModelLoader) GreedyLoader(modelFile string, llamaOpts []llama.ModelOpt
 	ml.mu.Unlock()
 	var err error

-	for _, b := range backends {
+	for _, b := range autoLoadBackends {
 		if b == BloomzBackend || b == WhisperBackend || b == RwkvBackend { // do not autoload bloomz/whisper/rwkv
 			continue
 		}