Gentian ist ein SRAM-First-Inferenzsubstrat für Long-Context-Transformer-Serving; interne kalibrierte Projektionen zielen auf ein bis zwei Grössenordnungen weniger Energie pro Token in Bereichen, in denen HBM-Kapazität und Scale-out-Koordination die Serving-Kosten dominieren.
Gentian ist nach dem Enzian benannt — einer Wildblume, in Europa weit verbreitet, typisch für die Schweizer Alpen und in der traditionellen Medizin verwendet.
Problem
Heutige Beschleuniger konzentrieren schnellen Modellzustand hinter einer HBM-Grenze. HBM verbessert die Bandbreite, aber die Kapazität des schnellen Speichers bleibt package-gebunden. Bei langen Kontextlängen läuft aktiver Zustand über Packages und Scale-out-Fabrics; die Kosten dafür fallen auf dem kritischen Serving-Pfad an.
Position
Gentian nimmt die entgegengesetzte physikalische Position ein: schneller lokaler Speicher und Compute skalieren gemeinsam über Standard-Logik-Tiles. Jeder zusätzliche Tile bringt lokale Speicher- und Compute-Kapazität bei. Das Designziel ist begrenzt-latente Inferenz bei Kontextlängen, an denen monolithische HBM-Packages strukturell ineffizient werden.
Effizienz-Ziel
Interne kalibrierte Projektionen weisen ein bis zwei Grössenordnungen weniger Energie pro Token für ausgewählte Long-Context-Inferenz-Bereiche im Vergleich zu HBM-zentriertem Scale-out aus. Detaillierte Annahmen, Kalibrierungsartefakte, Vergleichsmethodik und Implementierungs-Evidenz werden ausschliesslich unter gegenseitigem NDA besprochen.
Architekturgrenze
Öffentliche Materialien beschreiben Gentian ausschliesslich auf Substratebene. Das detaillierte Ausführungsmodell, die Protokollstruktur, die Scheduling-Semantik, die RTL-Evidenz, das Simulationsarchiv und die Physical-Design-Reports werden ausschliesslich unter gegenseitigem NDA bereitgestellt.
Öffentliche Eigenschaften:
- SRAM-First-verteiltes Substrat.
- Standard-Logik-Tiles.
- Lokaler Speicher skaliert mit Anzahl Tiles.
- Kein HBM auf dem kritischen Pfad.
- Ausgelegt für Long-Context-Transformer-Serving.
- Engineering-Review verfügbar unter NDA.
Diligence-Paket
Gentian ist ein aktives cybiont-Engineering-Programm. Das unter gegenseitigem NDA verfügbare Diligence-Paket umfasst:
- Architektur-Manuskript.
- Referenzmodell- und RTL-Paritäts-Zusammenfassung.
- FPGA-Bring-up-Status.
- Physical-Design-Artefakt-Übersicht.
- Simulationsarchiv-Index.
- IP- und FTO-Diskussion über Counsel.
Öffentliche Einordnung
Diese Seite gibt Investoren, technischen Partnern und Diligence-Teams eine belastbare Einordnung von Gentian: Architektur, technischer Ansatz und aktueller Entwicklungsstand. Konkrete Performance-Werte für Produktions-Silizium, kommerzielle Node-Projektionen, detaillierte Benchmark-Methodik, Protokollmechanik und Implementierungs-Evidenz stellt cybiont in kontrollierter technischer Diligence bereit.
Strategische Diligence für AI-Inferenz-Infrastruktur
Gentian adressiert die Speicher- und Datenbewegungsgrenzen HBM-zentrierter AI-Inferenz.
Architektur-, RTL-, FPGA-Bring-up-, Physical-Design- und Simulationsevidenz sowie IP/FTO-Diskussionen sind unter gegenseitigem NDA für Halbleiterunternehmen, Foundries, Hyperscaler und strategische Deep-Tech-Investoren verfügbar.