50+ AI MODELS

Все топовые LLM модели
через единый API

Доступ к GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro, Llama 4, Grok 4, DeepSeek V4 и другим моделям. OpenAI-совместимый формат, работает из России без VPN.

Текстовые модели: 22+

Графические модели: 6+

Реранкеры: 3+

Текстовые модели

Генерация текста, код, рассуждения, анализ

GPT-5.5

OpenAI•5.5

Flagship

256K tokens

Текущий флагман OpenAI: лучшее качество в семействе GPT-5 для сложной работы со знаниями, длинного контекста и мультимодальных задач. Подходит для аналитики, исследования, генерации структурированных артефактов.

Flagship

Long context

Multimodal

Multi-step reasoning

GPT-5.3-Codex

OpenAI•5.3-Codex

Code

200K tokens

Специализированная модель OpenAI для кодинга из линейки 5.x Codex. Сильна в генерации кода, рефакторинге и навигации по большим репозиториям. Хорошо работает в IDE-сценариях и агентных пайплайнах.

Code specialist

Refactoring

Repo navigation

Agentic

GPT-5

OpenAI•5

Flagship

128K tokens

Стабильный флагман предыдущего поколения. Хороший компромисс между качеством и стоимостью для большинства общих задач, остаётся востребованным в продакшене.

Smart

Fast

Stable

Cost-effective

Claude Opus 4.7

Anthropic•4.7

Flagship

200K tokens (beta 1M)

Текущий флагман Anthropic. Сильна в кодинге, планировании и работе с большими кодовыми базами: code review, отладка, агентные задачи. Доступен также ускоренный вариант Opus 4.7 Fast.

Flagship

Code review

Debugging

1M beta context

Large codebases

Claude Sonnet 4.6

Anthropic•4.6

Balanced

200K tokens

Сбалансированная модель семейства Claude 4. Оптимальное соотношение качества, скорости и стоимости для большинства продуктовых задач — поэтому чаще всего именно она в проде.

Balanced

Fast

Cost-effective

Production-ready

Claude Haiku 4.5

Anthropic•4.5

Fast

200K tokens

Самая быстрая и экономичная модель Claude. Идеальна для задач, где важна скорость ответа при сохранении хорошего качества.

Ultra-fast

Low latency

Budget-friendly

Gemini 3.1 Pro

Google•3.1 Pro Preview

Flagship

1M tokens

Текущий флагман Google с контекстным окном в 1 млн токенов. Лидер в мультимодальных задачах (текст/изображения/аудио/видео), сильный кандидат для анализа больших документов и многошагового рассуждения.

Multimodal

1M context

Audio/Video/Image

Preview

Gemini 3 Flash

Google•3 Flash

Fast

1M tokens

Быстрая мультимодальная модель Google поколения Gemini 3. Низкая задержка и невысокая стоимость токена при контексте до 1M токенов — удобна для агентов, фоновой обработки и интерактивных продуктов.

Low latency

1M context

Multimodal

Cost-effective

Llama 4 Maverick

Meta•4.0 Maverick (MoE 400B/17B active)

Open Source

1M tokens

Open-weight MoE-флагман Meta: 400B параметров суммарно, 17B активных, 128 экспертов. Мультимодальная модель общего назначения с контекстом до 1M токенов — подходит для агентных пайплайнов и работы с длинными документами.

MoE 400B / 17B active

1M context

Multimodal

Open-weight

Llama 4 Scout

Meta•4.0 Scout (MoE 109B/17B active)

Open Source

10M tokens

Облегчённая open-weight MoE-модель Meta: 109B параметров суммарно, 17B активных, 16 экспертов. Главное отличие — экстремально длинный контекст до 10M токенов, удобный для анализа больших корпусов и логов.

MoE 109B / 17B active

10M context

Multimodal

Open-weight

DeepSeek R1

DeepSeek•R1-0528

Reasoning

256K tokens

Reasoning-модель DeepSeek с прозрачной цепочкой рассуждений. MoE-архитектура: 671B параметров суммарно, 37B активных. Сильна в математике и кодинге, показывает шаги рассуждения явно — удобно для проверки и отладки логики.

Transparent reasoning

MoE 671B / 37B active

Math

Code

DeepSeek V4 Pro

DeepSeek•V4 Pro

Balanced

256K tokens

Старшая базовая модель нового поколения DeepSeek. Преемник линейки V3.x — сильна в общих задачах и кодинге, удерживает баланс между качеством и стоимостью.

General purpose

Strong baseline

256K context

Code-aware

Kimi K2 Thinking

Moonshot AI•K2 Thinking

Reasoning

200K tokens

Reasoning-вариант Kimi K2 от Moonshot. Делает упор на пошаговое рассуждение и многоступенчатые задачи — близко по духу к DeepSeek R1, но с другим распределением сильных сторон (хорошо на длинном контексте и инструментах).

Reasoning

Chain-of-thought

Long context

Tool use

Codestral 25.08

Mistral AI•25.08

Code

256K tokens

Coding-модель Mistral для генерации, рефакторинга и автодополнения. Поддерживает 80+ языков программирования и fill-in-the-middle (FIM) — удобна для IDE-сценариев, scaffolding и генерации тестов.

Code specialist

80+ languages

FIM support

256K context

Qwen 3.6 Max

Alibaba•3.6 Max Preview

Flagship

256K tokens

Текущий флагман линейки Qwen от Alibaba. Заметный прирост в рассуждениях, следовании инструкциям, использовании инструментов и мультиязычных задачах относительно Qwen 3.

Flagship

Multilingual

Tool use

Long context

Preview

Qwen3-Coder-Plus

Alibaba•Coder-Plus

Code

256K tokens

Старшая coding-модель линейки Qwen3-Coder. Сильна в генерации, рефакторинге и навигации по большим репозиториям. Подходит для IDE-сценариев и агентных пайплайнов.

Code specialist

Repo-aware

Refactoring

Agentic

Grok 4

xAI•4

Performance

256K tokens

Флагман xAI с упором на рассуждения, кодинг и использование инструментов. Сильный baseline для агентных пайплайнов, сложной аналитики и многошаговых задач.

Reasoning

Agentic

Tool use

Long context

Grok 4 Fast

xAI•4 Fast

Fast

256K tokens

Облегчённая версия Grok 4 с низкой задержкой. Хорошее соотношение качества и стоимости для массовых интеграций, чат-ботов и фоновой генерации.

Low latency

Cost-effective

Long context

GLM 4.7 Flash

Z.AI•4.7 Flash

Efficient

128K tokens

Быстрый и недорогой вариант линейки GLM от Z.AI (Zhipu). Подходит для рутинных задач: суммаризация, извлечение данных, простая генерация, классификация.

Fast

Cheap

General purpose

Perplexity Sonar

Perplexity•Sonar

128K tokens

Специализированная модель для поиска и анализа информации в реальном времени. Интегрирована с веб-поиском для получения актуальных данных.

Real-time search

Web-integrated

Up-to-date info

GigaChat-2-Max

Cloud.ru•GigaChat 2 Max

Enterprise

128K tokens

Флагман GigaChat от Сбера. Подходит для корпоративных задач с русским языком: документы, аналитика, ассистенты — с учётом регуляторных требований РФ.

Русский язык

Enterprise

RU-ready

Compliance

YandexGPT 5 Pro

Yandex•5 Pro

Enterprise

32K tokens

Старшая модель YandexGPT 5 с сильной поддержкой русского языка. Хороший выбор для российских интеграций: поиск, переводы, бизнес-документы.

Русский язык

Enterprise

RU-ready

Графические модели

Генерация изображений, иллюстраций, дизайн

GPT Image 1.5

OpenAI•1.5

Text Excellence

до 4K

Текущая флагманская модель OpenAI для генерации изображений. Сильна в рендеринге текста на картинке и реализации сложных многосоставных промптов, держит хороший баланс качества и стоимости.

Text rendering

Complex prompts

Flagship

GPT-5 Image

OpenAI•5 Image

Professional

до 4K

Флагманская генерация изображений на базе GPT-5. Преемник линейки Image — сильный prompt-following, мультимодальный контекст, профессиональное качество рендера и текста на картинке.

Flagship

Prompt-following

Text rendering

High detail

GPT-5 Image Mini

OpenAI•5 Image Mini

Balanced

до 2K

Облегчённая версия GPT-5 Image. Дешевле и быстрее старшей модели, при этом сохраняет качество для большинства типовых задач: иллюстрации, обложки, мокапы.

Fast

Cost-effective

Reliable

Gemini 3 Pro Image

Google•3 Pro Image Preview

Photorealism

до 4K

Image-режим флагманского Gemini 3 Pro. Сильный фотореализм и работа с типографикой/композицией, отлично справляется со сложными многослойными сценами.

Photorealistic

Typography

Complex scenes

Preview

Gemini 3.1 Flash Image

Google•3.1 Flash Image Preview

Fast

до 2K

Быстрый image-режим Gemini 3.1 Flash. Низкая задержка и низкая стоимость генерации — удобно для пакетной обработки, превью и интерактивных продуктов.

Low latency

Cheap

Preview

Batch-friendly

Gemini 2.5 Flash Image

Google•2.5 Flash Image

Balanced

до 2K

Проверенная стабильная модель генерации изображений от Google. Хороший выбор для рабочих сценариев с предсказуемым качеством и стоимостью.

Stable

Predictable

General purpose

Реранкеры

Переранжирование результатов поиска для RAG

Cohere Rerank 3

Cohere•3

Reranker

Топовая модель для переранжирования поисковых результатов. Значительно улучшает точность и релевантность поиска в RAG-системах.

High accuracy

RAG optimization

Fast

Jina Reranker v3

Jina AI•v3

Reranker

Эффективная модель переранжирования с отличным балансом скорости и качества. Open-source решение для семантического поиска.

Open-source

Fast

Semantic search

BGE Reranker

BAAI•v2

Reranker

Мощный open-source reranker от Beijing Academy of AI. Отлично работает с мультиязычными запросами и Chinese-English поиском.

Open-source

Multilingual

Chinese-English

Начните использовать все модели прямо сейчас

OpenAI-совместимый API • Без VPN • Оплата в рублях

Получить API ключ

Все топовые LLM моделичерез единый API

Текстовые модели

GPT-5.5

GPT-5.3-Codex

GPT-5

Claude Opus 4.7

Claude Sonnet 4.6

Claude Haiku 4.5

Gemini 3.1 Pro

Gemini 3 Flash

Llama 4 Maverick

Llama 4 Scout

DeepSeek R1

DeepSeek V4 Pro

Kimi K2 Thinking

Codestral 25.08

Qwen 3.6 Max

Qwen3-Coder-Plus

Grok 4

Grok 4 Fast

GLM 4.7 Flash

Perplexity Sonar

GigaChat-2-Max

YandexGPT 5 Pro

Графические модели

GPT Image 1.5

GPT-5 Image

GPT-5 Image Mini

Gemini 3 Pro Image

Gemini 3.1 Flash Image

Gemini 2.5 Flash Image

Реранкеры

Cohere Rerank 3

Jina Reranker v3

BGE Reranker

Начните использовать все модели прямо сейчас

Все топовые LLM модели
через единый API