Skip to content

Gentian — SRAM-First-Inferenzsubstrat

Gentian-Programm-Mark

Gentian ist ein SRAM-First-Inferenzsubstrat für Long-Context-Transformer-Serving; interne kalibrierte Projektionen zielen auf ein bis zwei Grössenordnungen weniger Energie pro Token in Bereichen, in denen HBM-Kapazität und Scale-out-Koordination die Serving-Kosten dominieren.

Gentian ist nach dem Enzian benannt — einer Wildblume, in Europa weit verbreitet, typisch für die Schweizer Alpen und in der traditionellen Medizin verwendet.

Problem

Heutige Beschleuniger konzentrieren schnellen Modellzustand hinter einer HBM-Grenze. HBM verbessert die Bandbreite, aber die Kapazität des schnellen Speichers bleibt package-gebunden. Bei langen Kontextlängen läuft aktiver Zustand über Packages und Scale-out-Fabrics; die Kosten dafür fallen auf dem kritischen Serving-Pfad an.

Position

Gentian nimmt die entgegengesetzte physikalische Position ein: schneller lokaler Speicher und Compute skalieren gemeinsam über Standard-Logik-Tiles. Jeder zusätzliche Tile bringt lokale Speicher- und Compute-Kapazität bei. Das Designziel ist begrenzt-latente Inferenz bei Kontextlängen, an denen monolithische HBM-Packages strukturell ineffizient werden.

Effizienz-Ziel

Interne kalibrierte Projektionen weisen ein bis zwei Grössenordnungen weniger Energie pro Token für ausgewählte Long-Context-Inferenz-Bereiche im Vergleich zu HBM-zentriertem Scale-out aus. Detaillierte Annahmen, Kalibrierungsartefakte, Vergleichsmethodik und Implementierungs-Evidenz werden ausschliesslich unter gegenseitigem NDA besprochen.

Architekturgrenze

Öffentliche Materialien beschreiben Gentian ausschliesslich auf Substratebene. Das detaillierte Ausführungsmodell, die Protokollstruktur, die Scheduling-Semantik, die RTL-Evidenz, das Simulationsarchiv und die Physical-Design-Reports werden ausschliesslich unter gegenseitigem NDA bereitgestellt.

Öffentliche Eigenschaften:

  • SRAM-First-verteiltes Substrat.
  • Standard-Logik-Tiles.
  • Lokaler Speicher skaliert mit Anzahl Tiles.
  • Kein HBM auf dem kritischen Pfad.
  • Ausgelegt für Long-Context-Transformer-Serving.
  • Engineering-Review verfügbar unter NDA.

Diligence-Paket

Gentian ist ein aktives cybiont-Engineering-Programm. Das unter gegenseitigem NDA verfügbare Diligence-Paket umfasst:

  • Architektur-Manuskript.
  • Referenzmodell- und RTL-Paritäts-Zusammenfassung.
  • FPGA-Bring-up-Status.
  • Physical-Design-Artefakt-Übersicht.
  • Simulationsarchiv-Index.
  • IP- und FTO-Diskussion über Counsel.

Öffentliche Einordnung

Diese Seite gibt Investoren, technischen Partnern und Diligence-Teams eine belastbare Einordnung von Gentian: Architektur, technischer Ansatz und aktueller Entwicklungsstand. Konkrete Performance-Werte für Produktions-Silizium, kommerzielle Node-Projektionen, detaillierte Benchmark-Methodik, Protokollmechanik und Implementierungs-Evidenz stellt cybiont in kontrollierter technischer Diligence bereit.

Strategische Diligence für AI-Inferenz-Infrastruktur

Gentian adressiert die Speicher- und Datenbewegungsgrenzen HBM-zentrierter AI-Inferenz.

Architektur-, RTL-, FPGA-Bring-up-, Physical-Design- und Simulationsevidenz sowie IP/FTO-Diskussionen sind unter gegenseitigem NDA für Halbleiterunternehmen, Foundries, Hyperscaler und strategische Deep-Tech-Investoren verfügbar.

Gentian Technical Diligence anfragen →