Die Notwendigkeit der Inferenz
Das Timing ist entscheidend. Die Inferenz hat das Training als dominierende KI-Workload still und leise überholt und macht nun mit 37,5 Milliarden Dollar mehr als 55 % der Ausgaben für Cloud-KI-Infrastruktur aus – Tendenz weiter steigend. Entwickler, die diese Workloads ausführen, stehen jedoch vor einer schwierigen Entscheidung: Entweder zahlen sie Cloud-Gebühren pro Token, die sich mit zunehmender Nutzung summieren, oder sie kaufen Hardware, die an proprietäre Stacks gebunden ist, die sie nicht überprüfen, modifizieren oder wirklich besitzen können.
QuietBox 2 basiert auf einem anderen Ansatz: Entwickler, die die eigentliche Arbeit der KI leisten, sollten jede Ebene ihrer Rechenplattform sehen, steuern und besitzen können – von der Siliziumarchitektur bis zum Compiler. Es ist ideal für Entwickler und kleine bis mittlere Unternehmen, die eine Vor-Ort-Bereitstellung ohne Racks benötigen.
„Tenstorrent arbeitet intensiv an einer Open-Source-KI-Software und wir wollten ein Teraflop-Entwicklungssystem bauen, das in einem Labor oder Büro einfach zu bedienen ist und schnell und leise arbeitet. Es ist von oben bis unten offen, einschließlich der Maschinenbaukomponenten. Entwickeln Sie Ihre eigene Software oder Hardware. Sie können Ihre KI-Zukunft selbst gestalten“, sagte Jim Keller, CEO von Tenstorrent.
Echte Workloads sofort einsatzbereit
QuietBox 2 wird einsatzbereit geliefert. Es zeichnet sich in verschiedenen KI-Bereichen aus:
– LLMs & Coding: GPT-OSS 120B läuft vollständig auf dem Gerät – ein Modell mit 120 Milliarden Parametern, das privat an Ihrem Schreibtisch betrieben wird. Llama 3.1 70B läuft mit 476,5 Tokens pro Sekunde. Qwen3-32B wird als privater Coding-Agent eingesetzt und durchläuft ganze Codebasen ohne Cloud-Token-Beschränkungen.
– Kreativ & Multimodal: Flux übernimmt die Bildgenerierung und Wan 2.2 die Videosynthese vollständig lokal, sodass kreatives geistiges Eigentum nicht auf Servern von Drittanbietern gespeichert wird.
– Wissenschaftliche Forschung: Boltz-2, ein biomolekulares ML-Modell, sagt die Struktur eines Proteins mit 686 Aminosäuren in nur 49 Sekunden auf einem einzigen Blackhole-Prozessor voraus – eine Aufgabe, für die eine moderne CPU 45 Minuten benötigt. Dies entspricht der Leistung von Flaggschiff-Workstation-GPUs zu einem Bruchteil der Kosten. QuietBox 2 kann vier Proteinstrukturen parallel vorhersagen und erzielt damit einen viermal höheren Durchsatz.
Für Modelle, die nicht auf der vorinstallierten Liste stehen, kann TT-Forge – der Open-Source-KI-Compiler von Tenstorrent – Modelle von PyTorch, ONNX, TensorFlow, JAX und PaddlePaddle direkt auf der Hardware ausführen. Wenn es auf einem Standard-Framework läuft, kann es auch auf QuietBox 2 ausgeführt werden.
Siliziuminnovation ohne Speicher- und Netzwerkengpässe
Vier Blackhole-ASICs arbeiten als einheitliches Mesh-System innerhalb eines kompakten, schreibtischtauglichen Gehäuses zusammen. Das System verfügt über 480 Tensix-Kerne, die 2.654 TFLOPS bei BlockFP8-Genauigkeit liefern, unterstützt von 128 GB GDDR6-Hochgeschwindigkeitsspeicher und 256 GB DDR5-Arbeitsspeicher.
Diese Architektur integriert Rechenleistung und hochdichten SRAM auf einem einzigen Chip. Dieser Datenflussansatz bewegt Tensoren effizient durch den On-Chip-Speicher und umgeht dabei vollständig die DRAM-Engpässe, die den nachhaltigen Durchsatz auf herkömmlicher Hardware begrenzen. Durch die Verwendung von GDDR6 und On-Chip-SRAM vermeidet QuietBox 2 vollständig die Versorgungsengpässe bei High-Bandwidth-Speichern (HBM), die derzeit zu Preissteigerungen auf dem gesamten AI-Hardwaremarkt führen.
Das System läuft unter Ubuntu 24.04, wird an eine normale 120-V-Steckdose angeschlossen und erfordert weder ein Rack noch spezielle Elektroarbeiten oder einen Serverraum.
Open Source auf jeder Ebene
Jede Ebene der Software von QuietBox 2 ist Open Source. Dabei handelt es sich nicht nur um eine offene API auf einer Black Box, sondern um vollständige Stack-Transparenz.
– TT-Forge bietet Entwicklern vollständige Transparenz bei Graph-Lowering, Transformation, Optimierung und Ausführung.
– TT-Metalium, das Low-Level-AI-SDK, bietet Kontrolle auf Kernel-Ebene mit deterministischer Ausführung.
– TT-LLK verwaltet Low-Level-Kernel-Software.
Entwickler können genau sehen, was in jeder Phase ihrer Pipeline geschieht, auf Hardware-Ebene debuggen, jede Komponente forken und den Stack an ihre genaue Arbeitslast anpassen. Für souveräne KI-Implementierungen, regulierte Branchen und Forschungseinrichtungen, die garantieren müssen, wie ihre Infrastruktur mit Daten umgeht, ist diese Transparenz nicht nur ein Feature, sondern die Kernarchitektur.
Ein angenehmes Entwicklererlebnis
QuietBox 2 ist eine grundlegende Neukonzeption, die sich auf die Produktivität von Entwicklern und die Umwelteffizienz konzentriert. Das System wird vollständig vorkonfiguriert mit Ubuntu 24.04, dem kompletten Open-Source-Software-Stack und TT-Studio ausgeliefert und ermöglicht so eine schnelle Bereitstellung direkt nach dem Auspacken.
Dank technischer Fortschritte konnten der Stromverbrauch im Leerlauf und die Wärmeabgabe im Vergleich zu früheren Generationen um etwa 50 % reduziert werden. In Verbindung mit einer erheblich erweiterten Dokumentation und Entwicklertools wurde das neue flüssigkeitsgekühlte Gehäuse speziell für den leisen, dauerhaften Betrieb mit hoher Auslastung direkt auf dem Schreibtisch entwickelt.
Für kleine und mittlere Unternehmen bedeutet dieselbe Plug-and-Play-Einfachheit, dass KI lokal (on-premises) eingesetzt werden kann, ohne eigene Serverräume, spezielle Elektroinstallationen oder zusätzlichen IT-Aufwand – Inferenzkapazität, die früher ein Server-Rack erforderte, wird nun in einem Desktop-Formfaktor bereitgestellt.
Verfügbarkeit: TT-QuietBox™ 2 wird im zweiten Quartal 2026 weltweit ausgeliefert, zu einem Preis ab 9.999 Dollar. Um sich auf die Warteliste setzen zu lassen, besuchen Sie www.tenstorrent.com/waitlist/tt-quietbox.
Das System wird live auf der Game Developers Conference (GDC) 2026 vom 11. bis 13. März am Stand Nr. 1354 von Tenstorrent vorgeführt. Um einen Pressetermin auf der GDC zu vereinbaren, wenden Sie sich bitte an Salient PR unter der unten angegebenen Adresse.
Über Tenstorrent
Tenstorrent ist ein Unternehmen für KI-Computing. Unter der Leitung von CEO Jim Keller – dem Architekten von AMD Zen, Apple A4/A5 und Teslas Chip für vollautonomes Fahren – entwickelt das Unternehmen RISC-V-basierte KI-Prozessoren und -Systeme für Entwickler, Unternehmen und staatliche Infrastrukturen weltweit. Mit Unterstützung von Bezos Expeditions, Samsung, LG Electronics, Hyundai Motor Group, Fidelity und anderen hat Tenstorrent über 1 Milliarde Dollar aufgebracht und ist in Santa Clara, Austin, Toronto, Belgrad, Tokio, Bangalore, Singapur und Seoul tätig. Weitere Informationen finden Sie unter tenstorrent.com.
Medienkontakt:
Justin Mauldin
Salient PR
achievemore@salientpr.com
737.234.0936
QUELLE: Tenstorrent
Hinweis/Disclaimer zur Übersetzung (inkl. KI-Unterstützung): Die Originalmeldung in der Ausgangssprache (in der Regel Englisch) ist die einzige maßgebliche, autorisierte und rechtsverbindliche Fassung. Diese deutschsprachige Übersetzung/Zusammenfassung dient ausschließlich der leichteren Verständlichkeit und kann gekürzt oder redaktionell verdichtet sein. Die Übersetzung kann ganz oder teilweise mithilfe maschineller Übersetzung bzw. generativer KI (Large Language Models) erfolgt sein und wurde redaktionell geprüft; trotzdem können Fehler, Auslassungen oder Sinnverschiebungen auftreten. Es wird keine Gewähr für Richtigkeit, Vollständigkeit, Aktualität oder Angemessenheit übernommen; Haftungsansprüche sind ausgeschlossen (auch bei Fahrlässigkeit), maßgeblich ist stets die Originalfassung. Diese Mitteilung stellt weder eine Kauf- noch eine Verkaufsempfehlung dar und ersetzt keine rechtliche, steuerliche oder finanzielle Beratung. Bitte beachten Sie die englische Originalmeldung bzw. die offiziellen Unterlagen auf www.sedarplus.ca, www.sec.gov, www.asx.com.au oder auf der Website des Emittenten; bei Abweichungen gilt ausschließlich das Original.
Übermittelt durch das IRW-Press News-Service der IR-WORLD.com Finanzkommunikation GmbH
Für den Inhalt der Mitteilung bzw. des Research ist alleine der Ersteller der Nachricht verantwortlich. Diese Meldung ist keine Anlageberatung oder Aufforderung zum Abschluss bestimmter Börsengeschäfte.
IR-WORLD.com Finanzkommunikation GmbH
Wickepointgasse 13
A4611 Buchkirchen
Telefon: +43 (7242) 211930-11
Telefax: +43 (7242) 211930-10
http://www.IRW-Press.com
Telefon: +1 (604) 715-2057
E-Mail: office@ir-world.com
![]()
