embeding
self-hosted · ollama · openai-compatible

Один OpenAI-совместимый шлюз ко всем вашим локальным моделям.

Эмбеддинги и чат через Ollama за единым ключом. Очередь бережёт CPU, супер-админ модерирует ключи и видит нагрузку в реальном времени. Просто поменяйте base_url.

quickstart.pydrop-in
from openai import OpenAI

client = OpenAI(
    base_url="https://your-host/v1",
    api_key="sk-emb-…",  # ключ выдаётся в кабинете
)

client.embeddings.create(
    model="nomic-embed-text",
    input="привет, мир",
)