Zum Inhalt springen
Kontakt
Modulares Compute-Cluster, symbolisch für Private KI und KI-Infrastruktur in der Schweiz
Private KI · LLM · Schweizer Datacenter

KI-Infrastruktur Ihre eigene KI im Schweizer Datencenter.

Sensible Daten gehören nicht in eine US-Cloud. Wir betreiben Ihre eigene KI in unseren Schweizer Rechenzentren, auf Mac Studio und NVIDIA DGX Spark, shared oder dediziert. Private KI mit lokalen Modellen, vollem Datenschutz und Datenstandort Schweiz, unabhängig von den grossen US-Anbietern.

Ein API-Schlüssel zu einer US-Cloud ist kein Datenschutzkonzept.
Private KI heisst: Ihre Modelle, Ihre Daten, in der Schweiz.

HardwareMac Studio · NVIDIA DGX Spark
Bezugshared oder dediziert
ModelleLlama · Mistral · Qwen · Gemma · weitere
PatternRAG · Fine-Tuning · Inferenz
DatenstandortSchweiz · 100 %
StandorteZRH-01 / ZRH-02
Warum Private KI

KI nutzen, ohne Ihre Daten aus der Hand zu geben.

Ihre eigene KI

Eigene Modelle auf eigener Hardware in unserem Datacenter, statt geteilter Endpunkte bei einem US-Anbieter.

Datenschutz by Design

Schützenswerte und sensible Daten bleiben isoliert und verschlüsselt, Zugriff streng kontrolliert, auch vor uns.

Datenstandort Schweiz

Verarbeitung und Speicherung zu 100 % in der Schweiz, in unseren Rechenzentren ZRH-01 und ZRH-02.

Unabhängig von US-Clouds

Kein CLOUD Act, keine Abhängigkeit von einem einzelnen Hyperscaler, Schweizer Recht und Schweizer Betrieb.

Lokale LLMs & RAG

Offene Modelle, auf Ihrem Wissen verankert per RAG, präzise Antworten ohne dass Daten das Haus verlassen.

Betrieb durch uns

Wir richten ein, halten aktuell und überwachen rund um die Uhr, Reaktion nach vereinbartem SLA.

So fliessen Ihre Daten

Anfrage, Modell und Wissensbasis, alles in der Schweiz.

In der Schweiz (ZRH-01/02)
Ihre Systeme & Daten
Kein Abfluss in US-Clouds
Mac Studio

Mac Studio: viel Speicher, leise, effizient.

Apple Silicon mit grossem Unified Memory ist ideal, um lokale LLMs kosteneffizient zu betreiben. Selbst grössere Modelle passen dank bis zu mehreren hundert GB gemeinsamem Speicher direkt in den Arbeitsspeicher.

  • Sehr viel Unified Memory, grosse Modelle laufen ohne teure Spezial-GPUs.
  • Energieeffizient und leise, niedrige Betriebskosten pro Inferenz.
  • Kompakt und ausgereift, schnell im Datacenter bereitgestellt.
  • Ideal für Inferenz lokaler Modelle und Wissensassistenten (RAG).
Apple Mac Studio, Hardware für Private KI im Schweizer Datacenter
NVIDIA DGX Spark

NVIDIA DGX Spark: KI-Supercomputer im Kompaktformat.

Der DGX Spark bringt mit dem GB10 Grace-Blackwell-Superchip und 128 GB Unified Memory dedizierte KI-Leistung samt vollem NVIDIA- und CUDA-Ökosystem in einen kompakten Knoten, für Inferenz und Fine-Tuning.

  • Volles CUDA-Ökosystem, kompatibel mit gängigen KI-Frameworks und Tools.
  • 128 GB Unified Memory für Inferenz und Fine-Tuning lokaler Modelle.
  • Kompakter, dedizierter Knoten, koppelbar für grössere Modelle.
  • Ideal, wenn maximale GPU-Kompatibilität und Fine-Tuning gefragt sind.
Private Cloud ansehen
NVIDIA DGX Spark, KI-Supercomputer im Schweizer Datacenter
Technische Daten

Was wir typischerweise bereitstellen.

Mac StudioApple Silicon, sehr grosses Unified Memory, energieeffizient
NVIDIA DGX SparkGB10 Grace Blackwell, 128 GB, volles CUDA-Ökosystem
Bezugshared (geteilt) oder dediziert
Grössere GPU-ClusterNVIDIA L40S / H100 und mehr, auf Anfrage
Weitere Hardwareauf Anfrage
Lokale Modelle

Offene Modelle, die wir auf Ihrer Infrastruktur betreiben.

Wir sind anbieter-unabhängig und betreiben die führenden offenen, lokal lauffähigen Sprachmodelle, je nach Aufgabe, Sprache und verfügbarem Speicher, unter anderem:

Mit RAG (Retrieval-Augmented Generation) antworten diese Modelle auf Basis Ihrer eigenen Dokumente, nachvollziehbar und aktuell, ohne dass die Daten Ihre Umgebung verlassen.

Häufige Fragen

Was Unternehmen zur eigenen KI-Infrastruktur fragen.

Der Mac Studio bietet auf Apple Silicon sehr viel Unified Memory zu moderaten Kosten. Dadurch passen auch grössere Modelle direkt in den Speicher, ohne teure Spezial-GPUs. Dazu kommt ein sehr guter Wirkungsgrad: wenig Stromverbrauch, leiser Betrieb und niedrige Betriebskosten pro Anfrage. Ideal für die Inferenz lokaler LLMs und Wissensassistenten.

Die DGX Spark bringt mit dem GB10 Grace-Blackwell-Superchip und 128 GB Unified Memory dedizierte KI-Leistung im Kompaktformat. Der grosse Vorteil ist das volle NVIDIA- und CUDA-Ökosystem: nahezu jedes KI-Framework und -Tool läuft sofort. Sie eignet sich besonders für Fine-Tuning und Inferenz, und mehrere Knoten lassen sich für grössere Modelle koppeln.

Grob gesagt: Mac Studio punktet bei Inferenz mit grossem Speicher zu tiefen Betriebskosten, die DGX Spark bei maximaler GPU-Kompatibilität und Fine-Tuning im CUDA-Ökosystem. Oft empfehlen wir die eine oder andere je nach Anwendungsfall, manchmal auch beide. Wir beraten anbieter-unabhängig.

Shared heisst, Sie teilen sich die Hardware mit anderen Mandanten, sauber isoliert, das ist der günstige Einstieg. Dediziert heisst, ein Gerät steht ausschliesslich Ihnen zur Verfügung, mit voller Leistung und maximaler Isolation. Beides betreiben wir in unseren Schweizer Rechenzentren.

Ja. Modelle, Daten und RAG-Wissensbasis liegen und laufen in unseren Rechenzentren ZRH-01 und ZRH-02. Es gibt keinen Datenabfluss an US-Clouds, kein CLOUD Act, Verarbeitung und Speicherung zu 100 % in der Schweiz.

Offene Modelle wie Llama, Mistral, Qwen, Gemma, DeepSeek oder Phi laufen vollständig auf Ihrer Infrastruktur. Sie behalten die Gewichte, die Kontrolle und die Datenhoheit, kein externer Anbieter ist involviert.

RAG (Retrieval-Augmented Generation) verbindet ein Sprachmodell mit Ihrer eigenen Wissensbasis. Statt allgemeiner Antworten liefert das Modell Antworten auf Basis Ihrer Dokumente, Verträge und Daten, nachvollziehbar und aktuell.

Ja. Wir starten oft mit einem geteilten Knoten oder einem einzelnen Gerät und erweitern auf dedizierte Hardware oder grössere GPU-Cluster, wenn Last und Anwendungsfälle wachsen, ohne Architekturbruch.

Wir. Bereitstellung, Modell-Updates, Skalierung, Monitoring und Kostenkontrolle übernimmt unser Team, mit Überwachung rund um die Uhr und Reaktion nach SLA. Sie nutzen die Endpunkte, wir halten die Schicht darunter am Laufen.

Ihre eigene KI im Schweizer Datencenter?

Wir gehen mit Ihnen Anwendungsfall, passende Hardware (Mac Studio oder DGX Spark) und Datenschutz durch, mit konkreten Optionen statt Buzzwords.