dearwolf/LocalAI

mirror of https://github.com/mudler/LocalAI.git synced 2025-06-17 08:15:00 +00:00

Author	SHA1	Message	Date
FT	1f29b5f38e	Fix Typos and Improve Documentation Clarity (#5648 ) * Update p2p.go Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com> * Update GPU-acceleration.md Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com> --------- Signed-off-by: FT <140458077+zeevick10@users.noreply.github.com>	2025-06-15 16:04:44 +02:00
Ettore Di Giacinto	2d64269763	feat: Add backend gallery (#5607 ) * feat: Add backend gallery This PR add support to manage backends as similar to models. There is now available a backend gallery which can be used to install and remove extra backends. The backend gallery can be configured similarly as a model gallery, and API calls allows to install and remove new backends in runtime, and as well during the startup phase of LocalAI. Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add backends docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * wip: Backend Dockerfile for python backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * feat: drop extras images, build python backends separately Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixup on all backends Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * test CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Tweaks Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Drop old backends leftovers Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixup CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move dockerfile upper Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fix proto Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Feature dropped for consistency - we prefer model galleries Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add missing packages in the build image Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * exllama is ponly available on cublas Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * pin torch on chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Fixups to index Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Debug CI * Install accellerators deps Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Add target arch * Add cuda minor version Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use self-hosted runners Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * ci: use quay for test images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups for vllm and chatterbox Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Small fixups on CI Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chatterbox is only available for nvidia Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Simplify CI builds Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adapt test, use qwen3 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(model gallery): add jina-reranker-v1-tiny-en-gguf Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix(gguf-parser): recover from potential panics that can happen while reading ggufs with gguf-parser Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use reranker from llama.cpp in AIO images Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Limit concurrent jobs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io> Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-06-15 14:56:52 +02:00
David Thole	38c5d16b57	feat(docs): updating the documentation on fine tuning and advanced guide. (#5420 ) Some checks are pending Explorer deployment / build-linux (push) Waiting to run Details GPU tests / ubuntu-latest (1.21.x) (push) Waiting to run Details generate and publish intel docker caches / generate_caches (intel/oneapi-basekit:2025.1.0-0-devel-ubuntu22.04, linux/amd64, ubuntu-latest) (push) Waiting to run Details build container images / hipblas-jobs (-aio-gpu-hipblas, rocm/dev-ubuntu-22.04:6.1, hipblas, true, ubuntu:22.04, extras, latest-gpu-hipblas-extras, latest-aio-gpu-hipblas, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, auto, -hipblas-extras) (push) Waiting to run Details build container images / hipblas-jobs (rocm/dev-ubuntu-22.04:6.1, hipblas, true, ubuntu:22.04, core, latest-gpu-hipblas, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -hipblas) (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-intel-f16, quay.io/go-skynet/intel-oneapi-base:latest, sycl_f16, true, ubuntu:22.04, extras, latest-gpu-intel-f16-extras, latest-aio-gpu-intel-f16, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f16-… (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-intel-f32, quay.io/go-skynet/intel-oneapi-base:latest, sycl_f32, true, ubuntu:22.04, extras, latest-gpu-intel-f32-extras, latest-aio-gpu-intel-f32, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f32-… (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-nvidia-cuda-11, ubuntu:22.04, cublas, 11, 7, true, extras, latest-gpu-nvidia-cuda-11-extras, latest-aio-gpu-nvidia-cuda-11, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -cublas-cuda11-extras) (push) Waiting to run Details build container images / self-hosted-jobs (-aio-gpu-nvidia-cuda-12, ubuntu:22.04, cublas, 12, 0, true, extras, latest-gpu-nvidia-cuda-12-extras, latest-aio-gpu-nvidia-cuda-12, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -cublas-cuda12-extras) (push) Waiting to run Details build container images / self-hosted-jobs (quay.io/go-skynet/intel-oneapi-base:latest, sycl_f16, true, ubuntu:22.04, core, latest-gpu-intel-f16, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f16) (push) Waiting to run Details build container images / self-hosted-jobs (quay.io/go-skynet/intel-oneapi-base:latest, sycl_f32, true, ubuntu:22.04, core, latest-gpu-intel-f32, --jobs=3 --output-sync=target, linux/amd64, arc-runner-set, false, -sycl-f32) (push) Waiting to run Details Tests extras backends / tests-transformers (push) Waiting to run Details build container images / core-image-build (-aio-cpu, ubuntu:22.04, , true, core, latest-cpu, latest-aio-cpu, --jobs=4 --output-sync=target, linux/amd64,linux/arm64, arc-runner-set, false, auto, ) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, cublas, 11, 7, true, core, latest-gpu-nvidia-cuda-12, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -cublas-cuda11) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, cublas, 12, 0, true, core, latest-gpu-nvidia-cuda-12, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -cublas-cuda12) (push) Waiting to run Details build container images / core-image-build (ubuntu:22.04, vulkan, true, core, latest-gpu-vulkan, --jobs=4 --output-sync=target, linux/amd64, arc-runner-set, false, false, -vulkan) (push) Waiting to run Details build container images / gh-runner (nvcr.io/nvidia/l4t-jetpack:r36.4.0, cublas, 12, 0, true, core, latest-nvidia-l4t-arm64, --jobs=4 --output-sync=target, linux/arm64, ubuntu-24.04-arm, true, false, -nvidia-l4t-arm64) (push) Waiting to run Details Security Scan / tests (push) Waiting to run Details Tests extras backends / tests-rerankers (push) Waiting to run Details Tests extras backends / tests-diffusers (push) Waiting to run Details Tests extras backends / tests-coqui (push) Waiting to run Details tests / tests-linux (1.21.x) (push) Waiting to run Details tests / tests-aio-container (push) Waiting to run Details tests / tests-apple (1.21.x) (push) Waiting to run Details updating the documentation on fine tuning and advanced guide. This mirrors how modern version of llama.cpp operate	2025-05-21 19:11:00 +02:00
omahs	0f365ac204	fix: typos (#5376 ) Signed-off-by: omahs <73983677+omahs@users.noreply.github.com>	2025-05-16 12:45:48 +02:00
Ettore Di Giacinto	e52c66c76e	chore(docs/install.sh): image changes (#5354 ) chore(docs): image changes Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-14 19:28:30 +02:00
Ettore Di Giacinto	0e8af53a5b	chore: update quickstart Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-05-01 22:36:33 +02:00
Simon Redman	88857696d4	fix(CUDA): Add note for how to run CUDA with SELinux (#5259 ) * Add note to help run nvidia containers with SELinux * Use correct CUDA container references as noted in the dockerhub overview * Clean trailing whitespaces	2025-04-28 09:00:52 +02:00
Mohit Gaur	b6e3dc5f02	docs: update docs for DisableWebUI flag (#5256 ) Signed-off-by: Mohit Gaur <56885276+Mohit-Gaur@users.noreply.github.com>	2025-04-27 16:02:02 +02:00
Simon Redman	a65e012aa2	docs(Vulkan): Add GPU docker documentation for Vulkan (#5255 ) Add GPU docker documentation for Vulkan	2025-04-27 09:20:26 +02:00
Ettore Di Giacinto	2c9279a542	feat(video-gen): add endpoint for video generation (#5247 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-26 18:05:01 +02:00
Ettore Di Giacinto	cc3df759f8	chore(docs): improve installer.sh docs (#5232 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-21 22:11:43 +02:00
Ettore Di Giacinto	61cc76c455	chore(autogptq): drop archived backend (#5214 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-19 15:52:29 +02:00
Ettore Di Giacinto	7547463f81	Update quickstart.md Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-04-16 08:48:55 +02:00
Ettore Di Giacinto	4f239bac89	feat: rebrand - LocalAGI and LocalRecall joins the LocalAI stack family (#5159 ) * wip Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * docs Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Update lotusdocs and hugo Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * rephrasing Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Latest fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Adjust readme section Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-04-15 17:51:24 +02:00
Ettore Di Giacinto	ac4991b069	chore(docs): update sponsor logo Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-20 15:31:41 +01:00
Ettore Di Giacinto	f3ae94ca70	chore: update Image generation docs and examples (#4841 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-17 16:51:06 +01:00
Ettore Di Giacinto	7f90ff7aec	chore(llama-ggml): drop deprecated backend (#4775 ) The GGML format is now dead, since in the next version of LocalAI we already bring many breaking compatibility changes, taking the occasion also to drop ggml support (pre-gguf). Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-06 18:36:23 +01:00
Ettore Di Giacinto	28a1310890	chore(docs): enhance visibility Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:50:32 +01:00
Ettore Di Giacinto	2a702e9ca4	chore(docs): small updates Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:49:11 +01:00
Ettore Di Giacinto	3ecaea1b6e	chore(docs): update sponsors in the website Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-02-05 19:41:55 +01:00
Ettore Di Giacinto	af41436f1b	fix(tests): pin to branch for config used in tests (#4721 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-31 09:57:58 +01:00
Ettore Di Giacinto	72e52c4f6a	chore: drop embedded models (#4715 ) Since the remote gallery was introduced this is now completely superseded by it. In order to keep the code clean and remove redudant parts let's simplify the usage. Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-30 00:03:01 +01:00
Ettore Di Giacinto	7f62b418a4	chore(docs): add documentation for l4t images Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2025-01-29 15:16:07 +01:00
Maximilian Kenfenheuer	a37b2c765c	docs: update advanced-usage.md to reflect changes in #4700 (#4709 ) Signed-off-by: Maximilian Kenfenheuer <maximilian.kenfenheuer@ksol.it>	2025-01-28 22:58:35 +01:00
Gianluca Boiano	032a33de49	chore: remove deprecated tinydream backend (#4631 ) Signed-off-by: Gianluca Boiano <morf3089@gmail.com>	2025-01-18 18:35:30 +01:00
Gianluca Boiano	4bd8434ae0	fix(docs): add missing `-core` suffix to sycl images (#4630 ) Signed-off-by: Gianluca Boiano <morf3089@gmail.com>	2025-01-18 15:47:49 +01:00
mintyleaf	96306a39a0	chore(docs): extra-Usage and Machine-Tag docs (#4627 ) Rename LocalAI-Extra-Usage -> Extra-Usage, add MACHINE_TAG as cli flag option, add docs about extra-usage and machine-tag Signed-off-by: mintyleaf <mintyleafdev@gmail.com>	2025-01-18 08:58:38 +01:00
Ettore Di Giacinto	ab344e4f47	docs: update compatibility-table.md (#4557 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2025-01-07 21:20:44 +01:00
Ettore Di Giacinto	cab9f88ca4	chore(docs): add nvidia l4t instructions (#4454 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-23 18:59:33 +01:00
jtwolfe	ae9855a39e	chore(docs): patch p2p detail in env and docs (#4434 ) * Update distributed_inferencing.md Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> * Update .env Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> * Update distributed_inferencing.md whoops Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> --------- Signed-off-by: jtwolfe <jamie.t.wolfe@gmail.com> Co-authored-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-12-19 15:19:31 +01:00
Ettore Di Giacinto	3127cd1352	chore(docs): update available backends (#4325 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-05 16:57:56 +01:00
PetrFlegr	b90d78d9f6	Updated links of yamls (#4324 ) Updated links Links to deplyment*.yaml was changed Signed-off-by: PetrFlegr <ptrflegr@gmail.com>	2024-12-05 16:06:51 +01:00
Ettore Di Giacinto	44a5dac312	feat(backend): add stablediffusion-ggml (#4289 ) * feat(backend): add stablediffusion-ggml Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(ci): track stablediffusion-ggml Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Use default scheduler and sampler if not specified Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fixups Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Move cfg scale out of diffusers block Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * Make it working Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * fix: set free_params_immediately to false to call the model in sequence https://github.com/leejet/stable-diffusion.cpp/issues/366 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-12-03 22:41:22 +01:00
Ettore Di Giacinto	3c3050f68e	feat(backends): Drop bert.cpp (#4272 ) * feat(backends): Drop bert.cpp use llama.cpp 3.2 as a drop-in replacement for bert.cpp Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * chore(tests): make test more robust Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-11-27 16:34:28 +01:00
Adam Monsen	9cb30bedeb	integrations: add Nextcloud (#4233 ) Signed-off-by: Adam Monsen <haircut@gmail.com>	2024-11-24 10:33:18 +01:00
GPTLocalhost (Word Add-in)	c9c58a24a8	chore(docs): integrating LocalAI with Microsoft Word (#4218 ) Integrating LocalAI with Microsoft Word Signed-off-by: GPTLocalhost (Word Add-in) <72584872+GPTLocalhost@users.noreply.github.com>	2024-11-22 09:57:39 +01:00
rmmonster	f03bbf3188	fix: #4215 404 in documentation due to migrated configuration examples (#4216 ) update link to examples which have moved to their own repository Signed-off-by: Philipp Seelig <philipp@daxbau.net> Co-authored-by: Philipp Seelig <philipp@daxbau.net> Co-authored-by: Dave <dave@gray101.com>	2024-11-21 09:47:11 +01:00
mintyleaf	9892d7d584	feat(p2p): add support for configuration of edgevpn listen_maddrs, dht_announce_maddrs and bootstrap_peers (#4200 ) * add support for edgevpn listen_maddrs, dht_announce_maddrs, dht_bootstrap_peers * upd docs for libp2p loglevel	2024-11-20 14:18:52 +01:00
Arnaud A	0b3a55b9fe	docs: Update documentation for text-to-audio feature regarding response_format (#4038 )	2024-11-03 02:15:54 +00:00
Mauro Morales	7748eb6553	docs: add Homebrew as an option to install on MacOS (#3946 ) Add Homebrew as an option to install on MacOS Signed-off-by: Mauro Morales <contact@mauromorales.com>	2024-10-23 20:02:08 +02:00
Franco Lombardo	97cf028175	chore: update integrations.md with LLPhant (#3838 ) Signed-off-by: Franco Lombardo <f.lombardo69@gmail.com>	2024-10-15 09:41:39 +02:00
Ettore Di Giacinto	bf8e50a11d	chore(docs): add Vulkan images links (#3620 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-09-20 18:16:01 +02:00
Ettore Di Giacinto	11d960b2a6	chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both (#3428 ) * chore(cli): be consistent between workers and expose ExtraLLamaCPPArgs to both Fixes: https://github.com/mudler/LocalAI/issues/3427 Signed-off-by: Ettore Di Giacinto <mudler@localai.io> * bump grpcio Signed-off-by: Ettore Di Giacinto <mudler@localai.io> --------- Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-30 00:10:17 +02:00
Ettore Di Giacinto	12950cac21	chore(docs): update links Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-28 10:40:41 +02:00
Ettore Di Giacinto	d2da2f1672	chore(docs): add links to demo and explorer Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-28 10:38:18 +02:00
grant-wilson	de1fbdca71	Update quickstart.md (#3373 ) fix typo. Signed-off-by: grant-wilson <grantm.wilsonii@gmail.com>	2024-08-24 23:01:34 +02:00
Ettore Di Giacinto	0762aa5327	Update GPU-acceleration.md Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-08-24 09:58:49 +02:00
Ettore Di Giacinto	d3a217c254	chore(docs): update p2p env var documentation (#3350 ) Signed-off-by: Ettore Di Giacinto <mudler@users.noreply.github.com>	2024-08-21 13:09:57 +02:00
四少爷	2a3427e533	fix(docs): Refer to the OpenAI documentation to update the openai-functions docu… (#3317 ) * Refer to the OpenAI documentation to update the openai-functions documentation I saw the openai official website, apIn the description: The parameters `function_call` and `functions` have been replaced by `tool_choice` and `tools`.So I submitted this update;But I haven't read the code of localai, so I'm not sure if it also applies to localai. Signed-off-by: 四少爷 <sex@jermey.cn> * Update Usage Example The original usage example was too outdated, and calling with the new version of the openai python package would result in errors. Therefore, the curl example was rewritten (as curl examples are also used elsewhere). Signed-off-by: 四少爷 <sex@jermey.cn> * add python example Signed-off-by: 四少爷 <sex@jermey.cn> --------- Signed-off-by: 四少爷 <sex@jermey.cn>	2024-08-21 13:09:26 +02:00
Ettore Di Giacinto	9475a6fa05	chore: drop petals (#3316 ) Signed-off-by: Ettore Di Giacinto <mudler@localai.io>	2024-08-20 10:01:38 +02:00

1 2 3 4

195 commits