Hot Chips umfasst coole ARM

Hot Chips ist nicht der erste Ort, den Sie erwarten würden, über ARM zu hören. Die jährliche Konferenz, jetzt im 26. Jahr, ist wie der Name bekannt für die Berichterstattung über die Macht-hungrig “big iron” hinter den weltweit schnellsten Servern. ARM hingegen bietet die Technologie für die winzigen, Low-Power-Chips in fast allen Handys und Tabletten.

So war es interessant zu sehen, wie sehr ARM die diesjährige Show, die in dieser Woche stattfand, infiltrierte. Beide Keynotes waren im Zusammenhang mit ARM – eine von ARM CTO Mike Muller über die Macht Einschränkungen in alles von Sensoren zu Servern und die anderen von Qualcomm Rob Chandhok im Internet der Dinge – und die zweitägige Agenda enthalten weitere fünf Gespräche über ARM-basiert Chips.

Dies ist zum Teil ein Spiegelbild der wachsenden Bedeutung von Mobile Computing. Das rasante Wachstum von Smartphones und Tablets hat einen tiefgreifenden Einfluss auf alle Verbraucher-und Business-Technologie. Aber es ist auch ein Zeichen, dass die ARM-Technologie “den Stack aufwärts bewegt” und anfängt, x86 und andere Plattformen in neuen Bereichen wie Servern und Netzwerk- und Kommunikationsgeräten herauszufordern.

Vielleicht die größte ARM News bei Hot Chips war Nvidias Präsentation auf einer kommenden Version seines Tegra K1 mobilen Prozessors mit einem kundenspezifischen Kern namens Denver. Der aktuelle 32-Bit-Tegra K1, der in der Shield-Tablette Xiaomi MiPad und Acer Chromebook 13 verwendet wird, hat vier Cortex A15 CPU-Kerne. Die zweite Version hat zwei Denver CPU-Kerne, die auf dem ARMv8 64-Bit Befehlssatz basieren. Beide verwenden die gleiche Kepler-GPU mit 192 CUDA-Cores.

Darrell Boggs, Nvidias Director für CPU-Architektur und Principal Architect, sagte, dass der in Denver ansässige Tegra K1 die Leistung eines Einstiegs-Haswell-Core-Prozessors (Celeron 2955U) übertreffen wird und die schnellsten mobilen Chips wie Qualcomms Snapdragon 801, den Apple, übertreffen wird A7 und Intels Bay Trail Atoms. (Ich schrieb einen separaten Beitrag auf Denver mit mehr Details.)

In einem verwandten Vortrag diskutierte Nvidia, wie Tegra K1s “Desktop-Klasse” -Grafik und Dual-Image-Prozessoren neue Funktionen für mobile Geräte in Bereichen wie Gaming und Video-Verarbeitung, sowie eine Computer-Vision für fortgeschrittene Fahrerassistenzsysteme in Autos. Michael Ditty, der Tegra Architecture Manager von Nvidia, zeigte Testergebnisse, die auf den Xiaomi Mi Pad mit dem 2-Bit Tegra K1 hindeuteten, war 1,2 bis 1,6 mal besser als der “schnellste Wettbewerber” auf mobilen Benchmarks.

Wettbewerber AMD hat, auch umarmte ARM, aber nicht für mobile. Bei Hot Chips stellte AMD neue Informationen über den Opteron A1100 mit dem Codenamen Seattle vor, der derzeit in Stichproben ist und bis Ende dieses Jahres auf Servern einschließlich der SeaMicro-Linie von AMD verfügbar sein sollte. Seattle hat acht 64-Bit-Cortex-A57-CPU-Kerne, 4 MB L2-Cache und 8 MB L3-Cache, zwei Speicherkanäle für bis zu 128 GB DDR3- oder DDR4-Speicher mit Fehlerkorrektur, viele integrierte I / O (8 Lanes von PCIe Gen3 und 6Gbps SATA und zwei 10Gbps Ethernet Ports), einen Cortex A5 “Systemsteuerprozessor” für sicheren Start und einen Beschleuniger zur Beschleunigung von Verschlüsselung und Entschlüsselung.

Manchmal ist die tiefgreifendste Lösung, um das gesamte Problem zu ändern.

AMD-Ingenieur Sean White sagte, dass das Unternehmen halb-kundenspezifische Versionen von Seattle anbieten würde, das für spezifische Kundenanwendungen optimiert wird – etwas anderes wie Intel und IBM haben außerdem gesprochen. Leider hat AMD keine Angaben zur Frequenz, Leistung oder Leistung des Opteron A1100 gemacht, weil White sagte: “Wir sind noch eine kurze Zeit weg von der eigentlichen Produkteinführung.”

AppliedMicro behauptet, mit dem ersten 64-Bit-ARM-Server-Chip AMD und so gut wie alle anderen mit dem ersten 64-Bit-ARM-Serverchip geschlagen zu haben, aber seitdem hat X-Gene noch keine großen, öffentlichen Designgewinne Seine ProLiant Moonshot-Server noch auf AMD Opterons oder Intel Atome verlassen).

Bei Hot Chips stellte AppliedMicro zum ersten Mal eine detaillierte Roadmap, wie es Pläne zur Steigerung der Leistung und Fähigkeiten von X-Gene. Die kurze Antwort: viel mehr Kerne und eine schnellere Interconnect. Guarav Singh, AppliedMicros Vizepräsident der Technischen Strategie, sagte, es gibt viele Scale-out-Datencenter-Anwendungen besser geeignet für Systeme mit Tausenden von effizienten verbunden über ein Netzwerk mit hoher Bandbreite und geringer Latenz einschließlich Web Services Hosting, Web-Suche, NoSQL-Datenbanken und Analytik und Medien-Service.

Das derzeit in Produktion befindliche X-Gene 1 (Storm) wird von TSMC auf einem 40nm-Prozess hergestellt und verfügt über acht 2,4GHz ARMv8-Cores, vier DDR3-Speichercontroller, PCIe Gen3 und 6Gbps SATA sowie 10Gbps Ethernet. Das X-Gene 2 (Shadowcat), das auf einem fortschrittlicheren 28nm-Prozess hergestellt wird und ein verbessertes Kerndesign hat, wird derzeit entnommen. Er wird mit 8 oder 16 Cores mit einer Geschwindigkeit von 2,4 bis 2,8 GHz verfügbar sein. Aber die große Veränderung ist hier der Zusatz eines RoCE Host Channel Adapters. RoCE oder RDMA über Converged Ethernet, liefert die niedrigere Latenzzeit des Infiniband-RDMA-Protokolls über Standard-Ethernet-Hardware und -Software. Dies ist ein wichtiger Baustein für Cluster von Hunderten oder Tausenden von Mikroservern.

AppliedMicro zielt auf X-Gene 2, um eine Lücke zwischen konkurrierenden Microservers (Cavium ThunderX, Intel Atom C2000 “Avoton” und AMD Opteron A1100 “Seattle”) zu schließen, von denen es glaubt, dass sie eine geringere Leistung liefern werden, aber weniger kosten und die Xeon E5-2600 V2, die höhere Leistung liefert, aber zu einem höheren Preis. (Natürlich hat Intel auch seine eigene Xeon E3-Familie, um diese Lücke zu schließen und AMD hat eine ehrgeizige Roadmap für seine ARM-Server.) Im Vergleich zu X-Gene 1 wird ein 8-Core X-Gene 2 etwa 60 Prozent besser liefern (SPECint 2006), die doppelte Leistung auf Memcached, und etwa 25 Prozent bessere Leistung auf Apache Web-Service, nach Angaben des Unternehmens.

Ein Single-Server-Rack (42HE) X-Gene 2-Server haben bis zu 6.480 Threads und 50 TB Speicher (mit einer Peakbandbreite von 48 TBps). Aufgrund der RoCE-Interconnect, sagte Singh, dass die Server in der Lage, einen einzigen Pool von Speicher, die wie lokale Speicherplatz zu teilen ist.

Die dritte Generation von X-Gene wird der erste sein, der 16nm 3D-Transistoren, die als FinFETs bekannt sind, verwenden (derzeit nur Intel verwendet diese Art von Transistor, aber konkurrierende Gießereien planen, zu FinFETs zu wechseln, die irgendwann nächstes Jahr beginnen). Das X-Gene 3 (Skylark) verfügt über 16-64 ARMv8-CPU-Kerne der dritten Generation, die bis zu 3GHz, eine RoCE-Verbindung der zweiten Generation und eine neue Rack-Interconnect- Es wird im Jahr 2015 Probenahme.

BYOD-Richtlinie, neue Tablet-Kauf-Checkliste, Microsofts neuesten mobilen Plattformen bringen wieder mehr geschäftsfreundliche Funktionen, Verwaltung der Zustrom von Apple-Geräten in den Arbeitsplatz

Prozessoren: Intel startet Prozessoren der 7. Generation, um 4K UHD auf die Massen zu schieben, Prozessoren, Vision und neuronale Netze steigern die Nachfrage nach leistungsfähigeren Chips, Datenzentren, Nvidia startet virtuelle GPU-Überwachung, Analytics, Hardware, AMD schlägt gegen Intel-Dominanz mit Zen

Schließlich präsentierten ARM und Avago gemeinsam die Vorteile von ARM Cortex-CPU-Cores und CoreLink-Interconnects für die Vernetzung. Avago Axxia 5500, eine Linie von 28nm Kommunikationsprozessoren mit 16 Cortex A15 CPU-Cores, die mit dem CoreLink CCN-504 verbunden sind, ist für zellulare Basisstationen und andere Netzwerk- und Kommunikationsgeräte konzipiert. Die ARM-basierte Axxia-Linie wurde von LSI entwickelt, die Avago im Mai für $ 6,6 Milliarden erwarb. Während es interessant ist, dass ARM in neue Bereiche umzieht, wurde die Geschichte sogar in der Woche interessanter, als Intel verkündete, dass es plant, das Axxia Geschäft für $ 650 Million zu kaufen.

Intel startet Prozessoren der 7. Generation, um 4K UHD in die Massen zu schieben

Vision und neuronale Netze Antrieb Nachfrage nach leistungsfähigeren Chips

Nvidia startet virtuelle GPU-Überwachung, Analytics

AMD schlägt gegen Intel-Dominanz mit Zen zurück