Подписывайся на Telegram-канал — пишем про нейросети и ИИ сервисыПодписаться
Инфраструктура

Видеопамять графического процессора. Определяет максимальный размер модели, которую можно загрузить для инференса. Для LLama 70B в FP16 нужно ~140 GB VRAM.

Связанные термины