Groq

Groq -- платформа сверхбыстрого AI-инференса на собственных LPU-чипах (Language Processing Unit). Обеспечивает скорость генерации до 750 токенов в секунду, что в 10-18 раз быстрее GPU-решений. Поддерживает популярные open-source модели: Llama 3, Mixtral, Gemma. API-совместим с OpenAI, что упрощает миграцию. Идеален для приложений, требующих мгновенных ответов.

apiFreemiumapi

Перейти на сайт

Описание

Groq -- платформа сверхбыстрого AI-инференса на собственных LPU-чипах (Language Processing Unit). Обеспечивает скорость генерации до 750 токенов в секунду, что в 10-18 раз быстрее GPU-решений. Поддерживает популярные open-source модели: Llama 3, Mixtral, Gemma. API-совместим с OpenAI, что упрощает миграцию. Идеален для приложений, требующих мгновенных ответов.