Releases · ggerganov/llama.cpp

18 Nov 18:38

d3481e6

b4126

cuda : only use native when supported by cmake (#10389)

Assets 21

18 Nov 11:09

github-actions

b4122

9b75f03

b4122

Vulkan: Fix device info output format specifiers (#10366)

* Vulkan: Fix device info output format specifiers

* Vulkan: Use zu printf specifier for size_t instead of ld

Assets 21

17 Nov 23:33

github-actions

b4120

76e9e58

b4120

CUDA: fix MMV kernel being used for FP16 src1 (#10357)

Assets 21

17 Nov 12:38

github-actions

b4118

be5cacc

b4118

llama : only use default buffer types for the KV cache (#10358)

Assets 21

17 Nov 10:43

github-actions

b4115

a431782

b4115

ggml : fix undefined reference to 'getcpu' (#10354)

https://github.com/ggerganov/llama.cpp/issues/10352

Assets 21

17 Nov 09:49

github-actions

b4114

c3ea58a

b4114

CUDA: remove DMMV, consolidate F16 mult mat vec (#10318)

Assets 21

17 Nov 09:47

github-actions

b4113

467576b

b4113

CMake: default to -arch=native for CUDA build (#10320)

Assets 21

17 Nov 07:55

github-actions

b4112

eda7e1d

b4112

ggml : fix possible buffer use after free in sched reserve (#9930)

Assets 21

17 Nov 07:34

github-actions

b4111

24203e9

b4111

ggml : inttypes.h -> cinttypes (#0)

ggml-ci

Assets 21

16 Nov 23:32

github-actions

b4103

4e54be0

b4103

llama/ex: remove --logdir argument (#10339)

Assets 21

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Releases: ggerganov/llama.cpp

b4126

b4122

b4120

b4118

b4115

b4114

b4113

b4112

b4111

b4103