Preise für Private AI
Wettbewerbsfähige Preise: Vorhersehbare Kosten, keine versteckten Gebühren
Überblick
Safe Swiss Cloud bietet eine Reihe von branchenüblichen KI-Produkten als Teil seiner „Private AI“ (PAI)-Produktfamilie an. Es umfasst Conversion-KI/Chat, Zugriff auf große Sprachmodelle (LLMs) über API, Unternehmens- und Entwicklertools, Integrationsdienste wie MCP-Server, um Systeme für KI zugänglich zu machen, Unterstützung für agentische KI einschließlich Workflows und Support-Services.
PAI Chat Preise
Dieser webbasierte Chatbot dient Endnutzerinnen und Endnutzern dazu, mit einem der verfügbaren Large Language Models zu interagieren.
Es besteht die Möglichkeit, dem LLM den Zugriff auf das Internet zu erlauben, damit es Fragen mit aktuellen Webdaten beantworten kann. Diese Option kann deaktiviert werden.
| Service | Beschreibung | Einheiten | Preis in CHF/EUR |
|---|---|---|---|
| PAI Chat | Chatbot mit erweiterten Funktionen, einschließlich Single Sign On (SSO), einer Auswahl von LLMs – großen Sprachmodellen – viele mit 70 Milliarden Parametern oder mehr, Hochladen von Dokumenten und Bildern für Analysen und Zusammenfassungen, Chat-Verläufe etc. | Pro Benutzer/Monat (on demand) Pro Benutzer/Monat (jährlich) | 35,00 30,00 |
| Websuche | Eine anonyme Websuche wird dem Kunden zur Verfügung gestellt. Ein „Meta-Suchserver“ bei Safe Swiss Cloud stellt sicher, dass die Websuchanfragen nicht auf den tatsächlichen Benutzer zurückgeführt werden können. Dieser Suchserver verwendet Web-Suchdienste ohne Tracking wie DuckDuckGo, Startpage, Wikipedia etc. Benutzer können die Websuche für jede Anfrage im PAI-Chat-Client ein- und ausschalten. Diese Funktion kann für einen Kunden auf Wunsch vollständig deaktiviert werden. | Anzahl Anfragen | Keine Kosten |
PAI API Preise
Alle Preise sind in CHF / EUR. Die Preise basieren auf der Anzahl (in Millionen) von Eingabe- und Ausgabe-Tokens, die pro Modell und Monat verwendet werden. Über eine OpenAI-API-kompatible Programmierschnittstelle (API) können Entwicklerinnen und Entwickler auf mehr als 25 LLMs zugreifen.
Es gilt ein Mindestverbrauch von 95 CHF oder EUR 100 (für nicht Schweizer Kunden) pro Monat für den Gesamtverbrauch von Input- und Output-Tokens aller Modelle. Die Preise pro Modell sind wie folgt:
| Modell | Typ | Preis in CHF/EUR pro Million Input-Tokens | Preis in CHF/EUR pro Million Output- Tokens | Details |
|---|---|---|---|---|
| apertus-8b | Chat | 0.152 | 0.165 | Optimiert für mehrsprachige Dialog-Anwendungsfälle. |
| apertus-70b | Chat | 0.712 | 2.553 | Optimiert für mehrsprachige Dialog-Anwendungsfälle. |
| bge-m3 | Embedding | 0.496 | Optimiert für Embeddings und Sparse Retrieval mit Unterstützung für Multifunktionalität, Mehrsprachigkeit und unterschiedliche Granularität. | |
| bge-reranker | Reranker | 0.009 | Optimiert als Reranker zur Ermittlung von Relevanz-Scores. | |
| deepseekr1-70b | Chat | 0.531 | 0.531 | Optimiert für auf Reasoning basierende Chat-Completions. |
| deepseekr1-670b | Chat | 2.254 | 5.256 | Optimiert für auf Reasoning basierende Chat-Completions. |
| deepseek-ocr | OCR | 0.443 | 1.770 | Optimiert für das einlesen von Dokumente |
| deepseek-v32 | Chat | 0.708 | 2.124 | Deepseek Version 3.2 |
| gemma-12b-it | Multimodal | 0.310 | 0.496 | Optimiert für die Verarbeitung von Text- und Bildeingaben sowie die Generierung von Textausgaben. |
| gpt-oss-120b | Chat | 0.133 | 0.531 | Optimiert für leistungsstarkes Reasoning, agentische Aufgaben und vielseitige Developer-Use-Cases. |
| granite-33-8b | Chat | 0.177 | 0.177 | Optimiert für Reasoning und Instruction-Following-Fähigkeiten. |
| granite-emb-278m | Embedding | 0.089 | Optimiert für Embeddings. | |
| granite-vision-2b | Multimodal | 0.089 | 0.089 | Optimiert als kompaktes, effizientes Vision-Language-Modell. |
| kimi-k2 | Chat | 0.886 | 2.657 | Optimiert für mehrsprachigen Dialog |
| llama33-70b | Chat | 0.628 | 0.628 | Optimiert für mehrsprachige Dialog-Anwendungsfälle. |
| llama4-maverick | Chat und Multimodal | 0.310 | 1.239 | Optimiert für Text- und Multimodal-Anwendungsfälle. |
| llama4-scout-17b | Chat und Multimodal | 0.221 | 0.735 | Optimiert für Text- und Multimodal-Anwendungsfälle. |
| mistral-v03-7b | Nur Chat | 0.177 | 0.177 | Optimiert für mehrsprachige Chat-Anwendungen. |
| qwen3-8b | Reasoning | 0.031 | 0.122 | Optimiert für Denken und Logik. |
| qwq-32b | Reasoning | 1.062 | 1.062 | Optimiert für Denken und Logik. |
| qwen3-vl-235b | Multimodal | 0.805 | 2.300 | Optimiert für Text- und Multimodal-Anwendungsfälle. |
| qwq25-vl-72b | Multimodal | 0.973 | 0.973 | Optimiert als kompaktes, effizientes Vision-Language-Modell. |
| Whisperx | Speech to Text | Coming soon | Coming soon | Zur Umwandlung von Sprache in Text. |
PAI Tools Preise
| Produkt | Beschreibung | Einheiten | Preis in CHF / EUR |
|---|---|---|---|
| PAI Tools für PAI Chat | Benutzerverwaltung (selbstbedienung) IAM Integration Rollenbasierter Modellzugriff | Fixpreis | 100.- |
PAI Integration Services Preise
| Service | Einheit | Preis |
|---|---|---|
| PAI Integration, z. B. Erstellung eines MCP-Servers | Pro Stunde, basierend auf effektiv geleisteten Stunden. | 250,00 |
| MCP-Wartung | Pro Stunde. | Preis auf Anfrage. Support-Pakete können dafür genutzt werden. |
| Managed MCP Service. Beinhaltet Sicherheitsupdates, Backups, Restores, Monitoring. | Fixpreis pro Monat | Abhängig vom MCP-Server. Angebot auf Anfrage. |
| Workflow-Integrationen | Pro Stunde. | Preis auf Anfrage. Support-Pakete können dafür genutzt werden. |
| Managed Workflow Service, z. B. basierend auf n8n. Beinhaltet Sicherheitsupdates, Backups, Restores und Monitoring. | Fixpreis pro Monat | Abhängig von der Komplexität des Workflows. Angebot auf Anfrage. |
PAI Workflow Hosting Preise
Safe Swiss Cloud bietet souveränes und privates Hosting für verschiedene AI-Workflow-Lösungen wie n8n. Damit können Kunden Agents erstellen, die Aufgaben und Workflows automatisieren.
| Service | Beschreibung | Preis |
|---|---|---|
| Managed Workflow Hosting n8n | Beinhaltet Serverinfrastruktur, Sicherheit, Backups, Monitoring und Applikationsmanagement. | 226,- |
| n8n Enterprise License | Diese wird für Multi-User-Installationen benötigt. | Nicht enthalten* |
PAI Support
Alle Safe Swiss Cloud Support-Pakete können für PAI-Support genutzt werden. SLA: 7×24 Verfügbarkeit mit einer maximalen Reaktionszeit von 1 Stunde.
| Jährliche Support-Pakete | Inklusive Stunden (gültig 12 Monate) | Ablauf der Support-Stunden | Preis/Monat CHF/EUR | Vertragsdauer (Monate) | Abrechnung |
|---|---|---|---|---|---|
| Annual Support 10 | 10 | Jährlich | 130 | 12 | Monatlich |
| Annual Support 25 | 25 | Jährlich | 330 | 12 | Monatlich |
| Annual Support 50 | 50 | Jährlich | 650 | 12 | Monatlich |
| Annual Support 100 | 100 | Jährlich | 1’250 | 12 | Monatlich |
| Annual Support 200 | 200 | Jährlich | 2’420 | 12 | Monatlich |
| Annual Support 300 | 300 | Jährlich | 3’000 | 12 | Monatlich |
Jährliche Support-Pakete, monatlich bezahlt: Die Supportstunden gelten für ein volles Jahr und verfallen nach 12 Monaten.
Nach 12 Monaten verlängert sich das Support-Paket automatisch um ein weiteres Jahr, sofern es nicht gekündigt wird. Die Kündigungsfrist beträgt mindestens 30 Tage und ist nur zum Ende eines Kalendermonats möglich.
Alle Support-Pakete können für AI, Cloud Computing und sämtliche Safe Swiss Cloud IT-Services genutzt werden.
Definitionen und Abkürzungen:
- PAI = Private AI
- LLM = Large Language Model
- API = Application Programming Interface
- SSO = Single Sign On
- Token = Verarbeitungseinheit für eine KI, typischerweise Teil eines Wortes