Подписывайся на Telegram-канал — пишем про нейросети и ИИ сервисыПодписаться

Пропускная способность

← Глоссарий
Инфраструктура

Количество токенов в секунду, которое модель может генерировать. Зависит от размера модели, квантизации, GPU и количества параллельных запросов.

Связанные термины