50+ AI MODELS

Все топовые LLM модели
через единый API

Доступ к GPT-5.5, Claude Opus 4.7, Gemini 3.1 Pro, Llama 4, Grok 4, DeepSeek V4 и другим моделям. OpenAI-совместимый формат, работает из России без VPN.

Текстовые модели: 22+
Графические модели: 6+
Реранкеры: 3+

Текстовые модели

Генерация текста, код, рассуждения, анализ

GPT-5.5

OpenAI5.5
Flagship
256K tokens

Текущий флагман OpenAI: лучшее качество в семействе GPT-5 для сложной работы со знаниями, длинного контекста и мультимодальных задач. Подходит для аналитики, исследования, генерации структурированных артефактов.

Flagship
Long context
Multimodal
Multi-step reasoning

GPT-5.3-Codex

OpenAI5.3-Codex
Code
200K tokens

Специализированная модель OpenAI для кодинга из линейки 5.x Codex. Сильна в генерации кода, рефакторинге и навигации по большим репозиториям. Хорошо работает в IDE-сценариях и агентных пайплайнах.

Code specialist
Refactoring
Repo navigation
Agentic

GPT-5

OpenAI5
Flagship
128K tokens

Стабильный флагман предыдущего поколения. Хороший компромисс между качеством и стоимостью для большинства общих задач, остаётся востребованным в продакшене.

Smart
Fast
Stable
Cost-effective

Claude Opus 4.7

Anthropic4.7
Flagship
200K tokens (beta 1M)

Текущий флагман Anthropic. Сильна в кодинге, планировании и работе с большими кодовыми базами: code review, отладка, агентные задачи. Доступен также ускоренный вариант Opus 4.7 Fast.

Flagship
Code review
Debugging
1M beta context
Large codebases

Claude Sonnet 4.6

Anthropic4.6
Balanced
200K tokens

Сбалансированная модель семейства Claude 4. Оптимальное соотношение качества, скорости и стоимости для большинства продуктовых задач — поэтому чаще всего именно она в проде.

Balanced
Fast
Cost-effective
Production-ready

Claude Haiku 4.5

Anthropic4.5
Fast
200K tokens

Самая быстрая и экономичная модель Claude. Идеальна для задач, где важна скорость ответа при сохранении хорошего качества.

Ultra-fast
Low latency
Budget-friendly

Gemini 3.1 Pro

Google3.1 Pro Preview
Flagship
1M tokens

Текущий флагман Google с контекстным окном в 1 млн токенов. Лидер в мультимодальных задачах (текст/изображения/аудио/видео), сильный кандидат для анализа больших документов и многошагового рассуждения.

Multimodal
1M context
Audio/Video/Image
Preview

Gemini 3 Flash

Google3 Flash
Fast
1M tokens

Быстрая мультимодальная модель Google поколения Gemini 3. Низкая задержка и невысокая стоимость токена при контексте до 1M токенов — удобна для агентов, фоновой обработки и интерактивных продуктов.

Low latency
1M context
Multimodal
Cost-effective

Llama 4 Maverick

Meta4.0 Maverick (MoE 400B/17B active)
Open Source
1M tokens

Open-weight MoE-флагман Meta: 400B параметров суммарно, 17B активных, 128 экспертов. Мультимодальная модель общего назначения с контекстом до 1M токенов — подходит для агентных пайплайнов и работы с длинными документами.

MoE 400B / 17B active
1M context
Multimodal
Open-weight

Llama 4 Scout

Meta4.0 Scout (MoE 109B/17B active)
Open Source
10M tokens

Облегчённая open-weight MoE-модель Meta: 109B параметров суммарно, 17B активных, 16 экспертов. Главное отличие — экстремально длинный контекст до 10M токенов, удобный для анализа больших корпусов и логов.

MoE 109B / 17B active
10M context
Multimodal
Open-weight

DeepSeek R1

DeepSeekR1-0528
Reasoning
256K tokens

Reasoning-модель DeepSeek с прозрачной цепочкой рассуждений. MoE-архитектура: 671B параметров суммарно, 37B активных. Сильна в математике и кодинге, показывает шаги рассуждения явно — удобно для проверки и отладки логики.

Transparent reasoning
MoE 671B / 37B active
Math
Code

DeepSeek V4 Pro

DeepSeekV4 Pro
Balanced
256K tokens

Старшая базовая модель нового поколения DeepSeek. Преемник линейки V3.x — сильна в общих задачах и кодинге, удерживает баланс между качеством и стоимостью.

General purpose
Strong baseline
256K context
Code-aware

Kimi K2 Thinking

Moonshot AIK2 Thinking
Reasoning
200K tokens

Reasoning-вариант Kimi K2 от Moonshot. Делает упор на пошаговое рассуждение и многоступенчатые задачи — близко по духу к DeepSeek R1, но с другим распределением сильных сторон (хорошо на длинном контексте и инструментах).

Reasoning
Chain-of-thought
Long context
Tool use

Codestral 25.08

Mistral AI25.08
Code
256K tokens

Coding-модель Mistral для генерации, рефакторинга и автодополнения. Поддерживает 80+ языков программирования и fill-in-the-middle (FIM) — удобна для IDE-сценариев, scaffolding и генерации тестов.

Code specialist
80+ languages
FIM support
256K context

Qwen 3.6 Max

Alibaba3.6 Max Preview
Flagship
256K tokens

Текущий флагман линейки Qwen от Alibaba. Заметный прирост в рассуждениях, следовании инструкциям, использовании инструментов и мультиязычных задачах относительно Qwen 3.

Flagship
Multilingual
Tool use
Long context
Preview

Qwen3-Coder-Plus

AlibabaCoder-Plus
Code
256K tokens

Старшая coding-модель линейки Qwen3-Coder. Сильна в генерации, рефакторинге и навигации по большим репозиториям. Подходит для IDE-сценариев и агентных пайплайнов.

Code specialist
Repo-aware
Refactoring
Agentic

Grok 4

xAI4
Performance
256K tokens

Флагман xAI с упором на рассуждения, кодинг и использование инструментов. Сильный baseline для агентных пайплайнов, сложной аналитики и многошаговых задач.

Reasoning
Agentic
Tool use
Long context

Grok 4 Fast

xAI4 Fast
Fast
256K tokens

Облегчённая версия Grok 4 с низкой задержкой. Хорошее соотношение качества и стоимости для массовых интеграций, чат-ботов и фоновой генерации.

Low latency
Cost-effective
Long context

GLM 4.7 Flash

Z.AI4.7 Flash
Efficient
128K tokens

Быстрый и недорогой вариант линейки GLM от Z.AI (Zhipu). Подходит для рутинных задач: суммаризация, извлечение данных, простая генерация, классификация.

Fast
Cheap
General purpose

Perplexity Sonar

PerplexitySonar
Search
128K tokens

Специализированная модель для поиска и анализа информации в реальном времени. Интегрирована с веб-поиском для получения актуальных данных.

Real-time search
Web-integrated
Up-to-date info

GigaChat-2-Max

Cloud.ruGigaChat 2 Max
Enterprise
128K tokens

Флагман GigaChat от Сбера. Подходит для корпоративных задач с русским языком: документы, аналитика, ассистенты — с учётом регуляторных требований РФ.

Русский язык
Enterprise
RU-ready
Compliance

YandexGPT 5 Pro

Yandex5 Pro
Enterprise
32K tokens

Старшая модель YandexGPT 5 с сильной поддержкой русского языка. Хороший выбор для российских интеграций: поиск, переводы, бизнес-документы.

Русский язык
Enterprise
RU-ready

Графические модели

Генерация изображений, иллюстраций, дизайн

GPT Image 1.5

OpenAI1.5
Text Excellence
до 4K

Текущая флагманская модель OpenAI для генерации изображений. Сильна в рендеринге текста на картинке и реализации сложных многосоставных промптов, держит хороший баланс качества и стоимости.

Text rendering
Complex prompts
Flagship

GPT-5 Image

OpenAI5 Image
Professional
до 4K

Флагманская генерация изображений на базе GPT-5. Преемник линейки Image — сильный prompt-following, мультимодальный контекст, профессиональное качество рендера и текста на картинке.

Flagship
Prompt-following
Text rendering
High detail

GPT-5 Image Mini

OpenAI5 Image Mini
Balanced
до 2K

Облегчённая версия GPT-5 Image. Дешевле и быстрее старшей модели, при этом сохраняет качество для большинства типовых задач: иллюстрации, обложки, мокапы.

Fast
Cost-effective
Reliable

Gemini 3 Pro Image

Google3 Pro Image Preview
Photorealism
до 4K

Image-режим флагманского Gemini 3 Pro. Сильный фотореализм и работа с типографикой/композицией, отлично справляется со сложными многослойными сценами.

Photorealistic
Typography
Complex scenes
Preview

Gemini 3.1 Flash Image

Google3.1 Flash Image Preview
Fast
до 2K

Быстрый image-режим Gemini 3.1 Flash. Низкая задержка и низкая стоимость генерации — удобно для пакетной обработки, превью и интерактивных продуктов.

Low latency
Cheap
Preview
Batch-friendly

Gemini 2.5 Flash Image

Google2.5 Flash Image
Balanced
до 2K

Проверенная стабильная модель генерации изображений от Google. Хороший выбор для рабочих сценариев с предсказуемым качеством и стоимостью.

Stable
Predictable
General purpose

Реранкеры

Переранжирование результатов поиска для RAG

Cohere Rerank 3

Cohere3
Reranker

Топовая модель для переранжирования поисковых результатов. Значительно улучшает точность и релевантность поиска в RAG-системах.

High accuracy
RAG optimization
Fast

Jina Reranker v3

Jina AIv3
Reranker

Эффективная модель переранжирования с отличным балансом скорости и качества. Open-source решение для семантического поиска.

Open-source
Fast
Semantic search

BGE Reranker

BAAIv2
Reranker

Мощный open-source reranker от Beijing Academy of AI. Отлично работает с мультиязычными запросами и Chinese-English поиском.

Open-source
Multilingual
Chinese-English

Начните использовать все модели прямо сейчас

OpenAI-совместимый API • Без VPN • Оплата в рублях

Получить API ключ
50+ LLM моделей | AgentPlatform — AI модели через единый API