Подписывайся на Telegram-канал — пишем про нейросети и ИИ сервисыПодписаться

llama.cpp

Инфраструктура

Высокооптимизированный движок для локального запуска LLM на CPU и GPU. Поддерживает GGUF-формат и различные квантизации. Один из самых популярных инструментов для запуска моделей на домашнем железе.

Связанные термины

GGUF Квантизация VRAM