embeding
self-hosted · ollama · openai-compatible
Один OpenAI-совместимый шлюз ко всем вашим локальным моделям.
Эмбеддинги и чат через Ollama за единым ключом. Очередь бережёт CPU, супер-админ модерирует ключи и видит нагрузку в реальном времени. Просто поменяйте base_url.