dearwolf/LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2025-06-21 18:24:59 +00:00

Author	SHA1	Message	Date
Ettore Di Giacinto	867db3f888	chore(docs): add backend url Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-17 22:35:21 +02:00
Ettore Di Giacinto	b79aa31398	chore: move backends docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-06-17 22:26:40 +02:00
FT	1f29b5f38e	Fix Typos and Improve Documentation Clarity (#5648 ) * Update p2p.go Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com> * Update GPU-acceleration.md Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com> --------- Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com>	2025-06-15 16:04:44 +02:00
Ettore Di Giacinto	2d64269763	feat: Add backend gallery (#5607 ) * feat: Add backend gallery This PR add support to manage backends as similar to models. There is now available a backend gallery which can be used to install and remove extra backends. The backend gallery can be configured similarly as a model gallery, and API calls allows to install and remove new backends in runtime, and as well during the startup phase of LocalAI. Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add backends docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * wip: Backend Dockerfile for python backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat: drop extras images, build python backends separately Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixup on all backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * test CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Tweaks Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop old backends leftovers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixup CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move dockerfile upper Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix proto Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Feature dropped for consistency - we prefer model galleries Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add missing packages in the build image Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * exllama is ponly available on cublas Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * pin torch on chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups to index Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Debug CI * Install accellerators deps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add target arch * Add cuda minor version Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use self-hosted runners Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * ci: use quay for test images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups for vllm and chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Small fixups on CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chatterbox is only available for nvidia Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify CI builds Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt test, use qwen3 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(model gallery): add jina-reranker-v1-tiny-en-gguf Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use reranker from llama.cpp in AIO images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Limit concurrent jobs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-06-15 14:56:52 +02:00
David Thole	38c5d16b57	feat(docs): updating the documentation on fine tuning and advanced guide. (#5420 ) Some checks are pending Explorer deployment / build-linux (push) Waiting to run Details GPU tests / ubuntu-latest (1.21.x) (push) Waiting to run Details generate and publish intel docker caches / generate_caches (intel/oneapi-basekit:2025.1.0-0-devel-ubuntu22.04, linux/amd64, ubuntu-latest) (push) Waiting to run Details build container images / hipblas-jobs (-aio-gpu-hipblas, rocm/dev-ubuntu-22.04:6.1, hipblas, true, ubuntu:22.04, extras, latest-gpu-hipblas-extras, latest-aio-gpu-hipblas, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, auto, -hipblas-extras) (push) Waiting to run Details build container images / hipblas-jobs (rocm/dev-ubuntu-22.04:6.1, hipblas, true, ubuntu:22.04, core, latest-gpu-hipblas, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -hipblas) (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-intel-f16, quay.io/go-skynet/intel-oneapi-base:latest, sycl_f16, true, ubuntu:22.04, extras, latest-gpu-intel-f16-extras, latest-aio-gpu-intel-f16, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f16-… (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-intel-f32, quay.io/go-skynet/intel-oneapi-base:latest, sycl_f32, true, ubuntu:22.04, extras, latest-gpu-intel-f32-extras, latest-aio-gpu-intel-f32, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f32-… (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-nvidia-cuda-11, ubuntu:22.04, cublas, 11, 7, true, extras, latest-gpu-nvidia-cuda-11-extras, latest-aio-gpu-nvidia-cuda-11, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -cublas-cuda11-extras) (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-nvidia-cuda-12, ubuntu:22.04, cublas, 12, 0, true, extras, latest-gpu-nvidia-cuda-12-extras, latest-aio-gpu-nvidia-cuda-12, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -cublas-cuda12-extras) (push) Waiting to run Details build container images / self-hosted-jobs (quay.io/go-skynet/intel-oneapi-base:latest, sycl_f16, true, ubuntu:22.04, core, latest-gpu-intel-f16, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f16) (push) Waiting to run Details build container images / self-hosted-jobs (quay.io/go-skynet/intel-oneapi-base:latest, sycl_f32, true, ubuntu:22.04, core, latest-gpu-intel-f32, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f32) (push) Waiting to run Details Tests extras backends / tests-transformers (push) Waiting to run Details build container images / core-image-build (-aio-cpu, ubuntu:22.04, , true, core, latest-cpu, latest-aio-cpu, --jobs=4 --output-sync=target, linux/amd64,linux/arm64, arc-runner-set, false, auto, ) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, cublas, 11, 7, true, core, latest-gpu-nvidia-cuda-12, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -cublas-cuda11) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, cublas, 12, 0, true, core, latest-gpu-nvidia-cuda-12, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -cublas-cuda12) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, vulkan, true, core, latest-gpu-vulkan, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -vulkan) (push) Waiting to run Details build container images / gh-runner (nvcr.io/nvidia/l4t-jetpack:r36.4.0, cublas, 12, 0, true, core, latest-nvidia-l4t-arm64, --jobs=4 --output-sync=target, linux/arm64, ubuntu-24.04-arm, true, false, -nvidia-l4t-arm64) (push) Waiting to run Details Security Scan / tests (push) Waiting to run Details Tests extras backends / tests-rerankers (push) Waiting to run Details Tests extras backends / tests-diffusers (push) Waiting to run Details Tests extras backends / tests-coqui (push) Waiting to run Details tests / tests-linux (1.21.x) (push) Waiting to run Details tests / tests-aio-container (push) Waiting to run Details tests / tests-apple (1.21.x) (push) Waiting to run Details updating the documentation on fine tuning and advanced guide. This mirrors how modern version of llama.cpp operate	2025-05-21 19:11:00 +02:00
omahs	0f365ac204	fix: typos (#5376 ) Signed-off-by: omahs <73983677+omahs@users.noreply.github.com>	2025-05-16 12:45:48 +02:00
Ettore Di Giacinto	e52c66c76e	chore(docs/install.sh): image changes (#5354 ) chore(docs): image changes Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-14 19:28:30 +02:00
Ettore Di Giacinto	0e8af53a5b	chore: update quickstart Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-01 22:36:33 +02:00
Simon Redman	88857696d4	fix(CUDA): Add note for how to run CUDA with SELinux (#5259 ) * Add note to help run nvidia containers with SELinux * Use correct CUDA container references as noted in the dockerhub overview * Clean trailing whitespaces	2025-04-28 09:00:52 +02:00
Mohit Gaur	b6e3dc5f02	docs: update docs for DisableWebUI flag (#5256 ) Signed-off-by: Mohit Gaur <56885276+Mohit-Gaur@users.noreply.github.com>	2025-04-27 16:02:02 +02:00
Simon Redman	a65e012aa2	docs(Vulkan): Add GPU docker documentation for Vulkan (#5255 ) Add GPU docker documentation for Vulkan	2025-04-27 09:20:26 +02:00
Ettore Di Giacinto	2c9279a542	feat(video-gen): add endpoint for video generation (#5247 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-26 18:05:01 +02:00
Ettore Di Giacinto	cc3df759f8	chore(docs): improve installer.sh docs (#5232 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-21 22:11:43 +02:00
Ettore Di Giacinto	61cc76c455	chore(autogptq): drop archived backend (#5214 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-19 15:52:29 +02:00
Ettore Di Giacinto	7547463f81	Update quickstart.md Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-04-16 08:48:55 +02:00
Ettore Di Giacinto	4f239bac89	feat: rebrand - LocalAGI and LocalRecall joins the LocalAI stack family (#5159 ) * wip Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Update lotusdocs and hugo Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * rephrasing Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Latest fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adjust readme section Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-15 17:51:24 +02:00
Ettore Di Giacinto	ac4991b069	chore(docs): update sponsor logo Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-20 15:31:41 +01:00
Ettore Di Giacinto	f3ae94ca70	chore: update Image generation docs and examples (#4841 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-17 16:51:06 +01:00
Ettore Di Giacinto	7f90ff7aec	chore(llama-ggml): drop deprecated backend (#4775 ) The GGML format is now dead, since in the next version of LocalAI we already bring many breaking compatibility changes, taking the occasion also to drop ggml support (pre-gguf). Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-06 18:36:23 +01:00
Ettore Di Giacinto	28a1310890	chore(docs): enhance visibility Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:50:32 +01:00
Ettore Di Giacinto	2a702e9ca4	chore(docs): small updates Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:49:11 +01:00
Ettore Di Giacinto	3ecaea1b6e	chore(docs): update sponsors in the website Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:41:55 +01:00
Ettore Di Giacinto	af41436f1b	fix(tests): pin to branch for config used in tests (#4721 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-31 09:57:58 +01:00
Ettore Di Giacinto	72e52c4f6a	chore: drop embedded models (#4715 ) Since the remote gallery was introduced this is now completely superseded by it. In order to keep the code clean and remove redudant parts let's simplify the usage. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-30 00:03:01 +01:00
Ettore Di Giacinto	7f62b418a4	chore(docs): add documentation for l4t images Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-29 15:16:07 +01:00
Maximilian Kenfenheuer	a37b2c765c	docs: update advanced-usage.md to reflect changes in #4700 (#4709 ) Signed-off-by: Maximilian Kenfenheuer <maximilian.kenfenheuer@ksol.it>	2025-01-28 22:58:35 +01:00
Gianluca Boiano	032a33de49	chore: remove deprecated tinydream backend (#4631 ) Signed-off-by: Gianluca Boiano <morf3089@gmail.com>	2025-01-18 18:35:30 +01:00
Gianluca Boiano	4bd8434ae0	fix(docs): add missing `-core` suffix to sycl images (#4630 ) Signed-off-by: Gianluca Boiano <morf3089@gmail.com>	2025-01-18 15:47:49 +01:00
mintyleaf	96306a39a0	chore(docs): extra-Usage and Machine-Tag docs (#4627 ) Rename LocalAI-Extra-Usage -> Extra-Usage, add MACHINE_TAG as cli flag option, add docs about extra-usage and machine-tag Signed-off-by: mintyleaf <mintyleafdev@gmail.com>	2025-01-18 08:58:38 +01:00
Ettore Di Giacinto	ab344e4f47	docs: update compatibility-table.md (#4557 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-07 21:20:44 +01:00
Ettore Di Giacinto	cab9f88ca4	chore(docs): add nvidia l4t instructions (#4454 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-23 18:59:33 +01:00
jtwolfe	ae9855a39e	chore(docs): patch p2p detail in env and docs (#4434 ) * Update distributed_inferencing.md Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> * Update .env Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> * Update distributed_inferencing.md whoops Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> --------- Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-12-19 15:19:31 +01:00
Ettore Di Giacinto	3127cd1352	chore(docs): update available backends (#4325 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-05 16:57:56 +01:00
PetrFlegr	b90d78d9f6	Updated links of yamls (#4324 ) Updated links Links to deplyment*.yaml was changed Signed-off-by: PetrFlegr <ptrflegr@gmail.com>	2024-12-05 16:06:51 +01:00
Ettore Di Giacinto	44a5dac312	feat(backend): add stablediffusion-ggml (#4289 ) * feat(backend): add stablediffusion-ggml Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(ci): track stablediffusion-ggml Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use default scheduler and sampler if not specified Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move cfg scale out of diffusers block Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Make it working Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: set free_params_immediately to false to call the model in sequence https://github.com/leejet/stable-diffusion.cpp/issues/366 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-03 22:41:22 +01:00
Ettore Di Giacinto	3c3050f68e	feat(backends): Drop bert.cpp (#4272 ) * feat(backends): Drop bert.cpp use llama.cpp 3.2 as a drop-in replacement for bert.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(tests): make test more robust Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-27 16:34:28 +01:00
Adam Monsen	9cb30bedeb	integrations: add Nextcloud (#4233 ) Signed-off-by: Adam Monsen <haircut@gmail.com>	2024-11-24 10:33:18 +01:00
GPTLocalhost (Word Add-in)	c9c58a24a8	chore(docs): integrating LocalAI with Microsoft Word (#4218 ) Integrating LocalAI with Microsoft Word Signed-off-by: GPTLocalhost (Word Add-in) <72584872+GPTLocalhost@users.noreply.github.com>	2024-11-22 09:57:39 +01:00
rmmonster	f03bbf3188	fix: #4215 404 in documentation due to migrated configuration examples (#4216 ) update link to examples which have moved to their own repository Signed-off-by: Philipp Seelig <philipp@daxbau.net> Co-authored-by: Philipp Seelig <philipp@daxbau.net> Co-authored-by: Dave <dave@gray101.com>	2024-11-21 09:47:11 +01:00
mintyleaf	9892d7d584	feat(p2p): add support for configuration of edgevpn listen_maddrs, dht_announce_maddrs and bootstrap_peers (#4200 ) * add support for edgevpn listen_maddrs, dht_announce_maddrs, dht_bootstrap_peers * upd docs for libp2p loglevel	2024-11-20 14:18:52 +01:00
Arnaud A	0b3a55b9fe	docs: Update documentation for text-to-audio feature regarding response_format (#4038 )	2024-11-03 02:15:54 +00:00
Mauro Morales	7748eb6553	docs: add Homebrew as an option to install on MacOS (#3946 ) Add Homebrew as an option to install on MacOS Signed-off-by: Mauro Morales <contact@mauromorales.com>	2024-10-23 20:02:08 +02:00
Franco Lombardo	97cf028175	chore: update integrations.md with LLPhant (#3838 ) Signed-off-by: Franco Lombardo <f.lombardo69@gmail.com>	2024-10-15 09:41:39 +02:00
Ettore Di Giacinto	bf8e50a11d	chore(docs): add Vulkan images links (#3620 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-20 18:16:01 +02:00
Ettore Di Giacinto	11d960b2a6	chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both (#3428 ) * chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both Fixes: https://github.com/mudler/LocalAI/issues/3427 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * bump grpcio Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-30 00:10:17 +02:00
Ettore Di Giacinto	12950cac21	chore(docs): update links Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-28 10:40:41 +02:00
Ettore Di Giacinto	d2da2f1672	chore(docs): add links to demo and explorer Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-28 10:38:18 +02:00
grant-wilson	de1fbdca71	Update quickstart.md (#3373 ) fix typo. Signed-off-by: grant-wilson <grantm.wilsonii@gmail.com>	2024-08-24 23:01:34 +02:00
Ettore Di Giacinto	0762aa5327	Update GPU-acceleration.md Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-08-24 09:58:49 +02:00
Ettore Di Giacinto	d3a217c254	chore(docs): update p2p env var documentation (#3350 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-08-21 13:09:57 +02:00

1 2 3 4

157 commits