Gateway

AI Gateway (он же LLM Gateway, Proxy, Router) — агрегатор моделей, предоставляющий единый API для доступа к языковым моделям разных провайдеров. Вместо интеграции с каждым провайдером отдельно, вы подключаете один шлюз и переключаетесь между моделями, меняя только название модели в запросе.

Зачем нужен

Единый API — один формат запросов для OpenAI, Anthropic, Google, DeepSeek и сотен других моделей
Fallback — если провайдер упал, запрос автоматически уходит к другому
Экономия — выбор провайдера с лучшей ценой за конкретную модель
Контроль расходов — бюджеты, лимиты, трекинг стоимости по ключам и командам
Наблюдаемость — логи, аналитика, трассировка запросов в одном месте
Кэширование — повторные запросы отдаются из кэша без обращения к модели

Сравнение

Шлюз	Тип	Моделей	Open Source	Кэш	Guardrails	Цена
OpenRouter	Облачный	300+	Нет	Нет	Нет	По токенам + наценка
LiteLLM	Self-hosted / Cloud	100+	Да	Да	Да	Бесплатно (OSS) / Enterprise
Portkey	SaaS + Self-hosted	1600+	Да	Да	Да	Free tier / платные планы
Polza.AI	Облачный (РФ)	400+	Нет	Нет	Нет	По токенам, оплата в ₽
One API	Self-hosted	—	Да	Нет	Нет	Бесплатно (OSS)

OpenRouter

openrouter.ai — облачный LLM-агрегатор с 300+ моделями от 60+ провайдеров.

Самый простой способ получить доступ ко всем популярным моделям через один API-ключ. Оплата по кредитам, без подписок.

Ключевые особенности:

Полная совместимость с OpenAI SDK — достаточно поменять base_url
Автоматический выбор провайдера с лучшей ценой/доступностью
Fallback между провайдерами при сбоях
5M+ пользователей, 70T токенов/месяц

Пример использования с OpenAI SDK:

from openai import OpenAI

client = OpenAI(
    base_url="https://openrouter.ai/api/v1",
    api_key="OPENROUTER_API_KEY",
)

response = client.chat.completions.create(
    model="anthropic/claude-sonnet-4",
    messages=[{"role": "user", "content": "Привет!"}],
)

Когда подходит: быстрый старт, доступ к максимуму моделей, не хочется поднимать инфраструктуру.

LiteLLM

litellm.ai — open-source прокси и Python SDK для унифицированного доступа к 100+ LLM-провайдерам.

Два режима работы: Python-библиотека (встраивается в код) и Proxy Server (self-hosted gateway с UI).

Ключевые особенности:

Self-hosted — данные не покидают вашу инфраструктуру
Виртуальные ключи с бюджетами и лимитами на команду/пользователя
Балансировка нагрузки и fallback между деплойментами
Guardrails, кэширование, observability (Langfuse, MLflow, Helicone)
Admin UI для мониторинга и управления

Запуск прокси:

pip install 'litellm[proxy]'
litellm --model openai/gpt-4o
# Proxy на http://0.0.0.0:4000

Пример через OpenAI SDK:

from openai import OpenAI

client = OpenAI(
    base_url="http://0.0.0.0:4000",
    api_key="any-key",
)

response = client.chat.completions.create(
    model="gpt-4o",
    messages=[{"role": "user", "content": "Привет!"}],
)

Когда подходит: self-hosted, контроль над данными, нужны бюджеты и управление ключами для команд.

Portkey

portkey.ai — production-платформа для управления LLM: gateway + observability + guardrails + prompt management.

Самый функциональный вариант для команд, которым важны governance и наблюдаемость.

Ключевые особенности:

1600+ моделей, 250+ провайдеров
Real-time observability с дашбордом
Guardrails: PII-редакция, контент-фильтрация, валидация
Prompt Engineering Studio — версионирование и A/B тестирование промптов
RBAC, SSO, аудит-логи (enterprise)
MCP Gateway для централизованного управления MCP-серверами

Интеграция в 3 строки:

import Portkey from "portkey-ai";

const portkey = new Portkey();

const completion = await portkey.chat.completions.create({
  messages: [{ role: "user", content: "Привет!" }],
  model: "@openai/gpt-4o",
});

Когда подходит: production-окружения, enterprise, нужны guardrails и полная наблюдаемость.

Polza.AI

polza.ai — российский LLM-агрегатор с 400+ моделями. Оплата в рублях, работает без VPN.

Аналог OpenRouter для российского рынка. Доступ к OpenAI, Anthropic, Google, DeepSeek, YandexGPT и другим моделям через единый API с оплатой российской банковской картой.

Ключевые особенности:

400+ моделей: текст, код, изображения, аудио, видео
OpenAI-совместимый API — работает с привычными SDK
Оплата в рублях, без конвертации валют
Работает без VPN и прокси из России
Fallback при сбоях провайдеров
Playground для тестирования моделей в браузере

Пример использования:

from openai import OpenAI

client = OpenAI(
    base_url="https://api.polza.ai/v1",
    api_key="POLZA_API_KEY",
)

response = client.chat.completions.create(
    model="openai/gpt-4o",
    messages=[{"role": "user", "content": "Привет!"}],
)

Когда подходит: работаете из России, нужна оплата в рублях без VPN.

One API

github.com/songquanpeng/one-api — open-source шлюз для управления LLM-ключами, популярен в китайском сообществе.

Лёгкий self-hosted gateway с веб-интерфейсом для управления каналами (провайдерами) и токенами.

Ключевые особенности:

Поддержка OpenAI, Anthropic, Google Gemini, локальных моделей
Управление множеством API-ключей и балансировка между ними
Квоты и ограничения на пользователей
Простой веб-интерфейс
Лёгкий деплой через Docker

Когда подходит: нужен простой self-hosted прокси для распределения ключей между пользователями.

Зачем нужен​

Сравнение​

OpenRouter​

LiteLLM​

Portkey​

Polza.AI​

One API​

Зачем нужен

Сравнение

OpenRouter

LiteLLM

Portkey

Polza.AI

One API