feat: fix CUDA images and update go-llama to use full GPU offloading (#618)

Signed-off-by: mudler <mudler@localai.io> Co-authored-by: mudler <mudler@localai.io>
2025-05-28 14:35:00 +00:00 · 2023-06-18 08:27:29 +02:00 · 2023-06-18 08:27:29 +02:00 · d3d3187e51
commit d3d3187e51
parent 6c94f3cd67
5 changed files with 11 additions and 47 deletions
--- a/.github/workflows/test.yml
+++ b/.github/workflows/test.yml
@ -41,4 +41,4 @@ jobs:

      - name: Test
        run: |
-          make test
+          CMAKE_ARGS="-DLLAMA_F16C=OFF -DLLAMA_AVX512=OFF -DLLAMA_AVX2=OFF -DLLAMA_FMA=OFF" make test