Frage:
Warum stellen wir keine CPUs mit Tausenden von Schichten her, um den Platz in der dritten Dimension zu nutzen?
Ethan
2020-07-27 12:38:02 UTC
view on stackexchange narkive permalink

Ich frage mich, warum wir keine Prozessoren wie CPUs mit Tausenden von gestapelten Schichten herstellen, um den Platz in der dritten Dimension zu nutzen, da wir dreidimensionale Transistoren haben. Um es klar auszudrücken, beziehe ich mich darauf, etwas aus einem Prozessor in Form eines rechteckigen Prismas zu machen.

Um klar zu sein, es gibt eine Menge, die mir bei der Prozessorherstellung nicht bewusst ist. Ich bin kein Elektro- oder Computeringenieur, aber ich bin sehr neugierig. Ich bin mir der Erwärmungsprobleme bewusst, die dies verursachen würde, wenn man eine noch dichtere Packung von Transistoren in Betracht zieht, und der Herstellungsprobleme, wenn man so viel Silizium laserätzen müsste, aber im Gegensatz zur Vergrößerung der Größe in Breite und Höhe würde es keine Probleme geben Machen Sie das Beste aus den kreisförmigen Siliziumwafern, und im Gegensatz dazu würden Sie die Teile sehr nahe beieinander halten, was bedeutet, dass die Geschwindigkeit, mit der der Strom von einem Teil des Prozessors zum anderen gelangt, nicht verlangsamt wird, da der Prozessor bereits über 1000 verfügt von horizontal und vertikal gestapelten Transistoren.

Ich bin gespannt, ob Sie die Heizprobleme lösen können, indem Sie dünne intermittierende Kühlkörperschichten auftragen und dabei den vertikalen Durchsatz beibehalten. Beheben Sie die Herstellungsprobleme teilweise, indem Sie etwa alle 10 Schichten separat geätzte Wafer verwenden. Könnte dies möglich sein oder gibt es viele Probleme, an die ich nicht denke (und ich bin mir sicher, dass es solche gibt)? Danke.

Wie genau stellen Sie sich diese "dünnen Kühlkörperschichten" vor?Ein Kühlkörper "sinkt" die Wärme nicht wirklich wie beim "Zerstören", sondern leitet sie einfach weg.Eine Schicht innerhalb des Stapels kann nur helfen, indem sie Wärme an die Seiten des Stempels leitet. Dies ist ein * langer * Weg (mindestens einige Millimeter), der ihn schrecklich ineffizient macht.
Warum machen wir nicht 1000 Schichtkuchen?Nach einer bestimmten Anzahl von Schichten beginnt es auseinander zu fallen, kann es nicht mit Zuckerguss fixieren.
@old_timer Ihr Beispiel ist schlecht gewählt: https://en.wikipedia.org/wiki/Mille-feuille
Ich habe keine 10-20-100-1000 Schicht gesehen, selbst wenn Sie Gebäck viele Male falten, ergibt dies keine konsistente Schicht, insbesondere nach der Verarbeitung (Backen).In beiden Fällen weist jede Schicht Inkonsistenzen auf, die sich auf jeder nachfolgenden Schicht verstärken (siehe Antworten unten). Wenn Sie das Wärmeproblem lösen könnten, hätten Sie das Stapelproblem.Genau wie ein Kuchen.Ein 50-Schicht-Kuchen für Preis- / Preiszwecke sicher, aber Massenproduktion, nicht so sehr.Mit Sicherheit keine 1000er Schicht.
Dann gibt es noch die Kosten, Masken machen einen großen Teil der Kosten eines Chips aus. Wenn eine kleine Anzahl von Schichten eine Handvoll bis zig Millionen ist, dann sind 1000 Schichten ... mehr als das Unternehmen wert ist.Und das ist, wenn Sie Ausrüstung dafür finden könnten.Es ist eine dumme Frage.Wir stellen nur Multi-Chip-Module her, die über High-End-Produkte hinausgehen.Wenn Ihr Prozess halb so groß ist wie der vorherige, entspricht dies ungefähr dem doppelt so hohen Stapeln.Es ist also nicht so, als würden sie nichts tun, um die Dichte und Leistung pro "Chip" zu erhöhen.
(Nicht das ganze Geld steckt in den Masken, was nicht impliziert, die Entwicklungstools allein sind Millionen von Dollar)
@TooTea Ich bin damit einverstanden, dass es "schrecklich ineffizient" wäre. Ich dachte nur, wenn Sie eine dicke Kühlkörperverkabelung direkt aus der CPU herausführen und sie mit einem Lüfter um einen Kühler anschließen könnten, könnte es möglich sein, genug Wärme abzuleiten, um sie zu erzeugenlebensfähig.Aber das ist natürlich eine vollständige Vermutung und die damit verbundene Hitze könnte sehr wohl verrückt sein, also erwarte ich voll und ganz, dass es nicht so gut funktioniert.
Im Allgemeinen hängt die Wärmeleitfähigkeit von der Fläche senkrecht zur Richtung der Wärmeübertragung ab.Da die Wärme an die Ränder gelangen muss, müssen diese „Kühlkörper“ -Schichten ziemlich dick sein.Ich vermute, dass es in der Größenordnung von Millimetern liegt.Alle Kühlmittelrohre sind ungefähr gleich.So wird die Schichttrennung nicht zu weit von den PCIe-Steckplätzen entfernt.
@James_pic Mille-feuille ist nur ein Name.Tatsächliche Kuchen haben 10 bis 20 Schichten (siehe Bilder auf der Seite, auf die Sie verlinkt haben).
@old_timer-Gebäude bestehen normalerweise aus 10 bis 20 bis 160 Schichten / Böden.3D-Drucke bestehen aus Hunderten von Ebenen.Diamanten sind natürliche und 3D-gedruckte unzählige Schichten.
Sechs antworten:
Neil_UK
2020-07-27 13:54:38 UTC
view on stackexchange narkive permalink

Die beiden Hauptgründe sind Ertrag und Hitze.

Ausbeute.Jedes Mal, wenn Sie einen Prozessschritt ausführen, erhalten Sie weniger als 100% Perfektion.Angenommen, Sie erhalten 99% Perfektion pro Schritt.In einem Prozess mit 20 Schritten wären Sie auf 82% gesunken.In einem Prozess mit 1000 Schritten wären Sie auf 43 ppm gesunken, 43 erfolgreiche Builds für jede Million gestarteter Wafer.

Hitze.Unsere bestehenden Konstruktionen sind bereits dadurch begrenzt, wie schnell wir dem Boden der Matrize Wärme entziehen können.Daher ist für uns weder die Möglichkeit, mehr Wärme zu erzeugen, noch die Möglichkeit, diese Wärme weiter entfernt von dem Ort zu erzeugen, an dem sie abgeführt werden kann, von wirklichem Nutzen.

Diese sagen, es gibt einige Geräte, die sich in der 3. Dimension aufbauen und mehrere fertige Wafer miteinander verbinden, was das Ertragsproblem mindert.Bei diesen gestapelten Wafern handelt es sich in der Regel um Speicher, die nicht die Leistung einer CPU verbrauchen, wodurch das Wärmeproblem gemindert wird.

Sie können Teile stapeln, die separat hergestellt wurden.Das eigentliche Problem ist die Hitze.
Ich habe von DRAM gehört, das oben gestapelt ist, und wir können mehr davon sehen, da sie bereits die Tests bestanden haben.Dies ist möglicherweise der einzige praktische Weg, um nach oben zu bauen, bis Sie eine Wärmeableitungsgrenze erreichen.
Flash wird oft gestapelt, wobei 16 oder mehr Würfel zusammen gestapelt werden.Hier ist Wärme weniger problematisch, da die zusätzlichen Schichten für die Kapazität vorgesehen sind - Sie greifen jeweils nur auf eine Schicht zu.Dies ist weniger einfach für CPUs, bei denen erwartet wird, dass alle gleichzeitig ausgelastet sind.
Wie Sie am Ende dort sagten, dachte ich, sie würden fertige Wafer wie 100 i7s oder i3s übereinander stapeln / verbinden, um einen i7-100 oder einen i3-100 zu erhalten. Diese Prozessoren haben bereits ungefähr 10 SchichtenSie erhalten 1000, und dies würde natürlich das 100-fache eines vorhandenen i3 oder i7 kosten, und die Leistungssteigerungen wären nicht genau 1 zu 1, aber die Dichteverbesserungen würden den Leistungsverlust für Supercomputerhersteller überwiegen.Und wenn Sie die Heizung mit einer dicken, intermittierend geschichteten Kühlkörperleitung direkt an einem Heizkörper befestigen könnten (groß wenn), dann ja.
@Ethan722 Eine High-End-CPU verfügt über weit über eine Milliarde Transistoren mit über 20 Kernen.Was Ingenieure wollen, sind keine gestapelten CPUs, sondern eine zusätzliche Schicht Dram oder Flash, selbst als separate Würfel.Was Sie vorschlagen, wird in unserem Leben nicht passieren.Extreme Dichte erzeugt IMMER zu viel Wärme, um lebensfähig zu sein.
Unser derzeitiges Rechenlimit liegt sehr selten bei der CPU-Verarbeitungsleistung.Der Datenzugriff ist der primäre Engpass und gilt seit Jahrzehnten.Für einen typischen Computer ist das Upgrade von HDD auf SSD und das Upgrade von RAM der größte Gewinn. Es gibt einen Grund, warum Werbetreibende auf das "BIG HERTZ" der CPU hinweisen und Ihnen einen Computer mit 2 bis 4 GB RAM zur Verfügung stellen.Das System wird sich sehr schnell verschlechtern und Sie werden denken, Sie brauchen ein neues, wenn ein 100-Dollar-RAM-Upgrade weitere 5-10 Jahre dauert.
@Ethan722 (kein EE-Experte, nur ein vorbeikommender Techniker) Die Wärmeableitung ist ein viel größeres Problem, als Ihr Kommentar vermuten lässt.Ein einzelner AMD Threadripper 3990x kann etwa 280 W Wärme abgeben.Wenn Sie sie irgendwie 100 hoch stapeln könnten, sprechen Sie jetzt von einer Verlustleistung (280 W * 100) = 28 kW Wärme.
Intel entwickelt derzeit etwas Ähnliches mit seiner Foveros-Stacking-Technologie.
@Ethan722,-CPUs stoßen seit etwa 20 Jahren an thermische Grenzen.Eine flache CPU gibt mehr Wärme pro Quadratmillimeter ab als ein Ofenbrenner.Ihre vorgeschlagene "gestapelte CPU" würde die eines Kernreaktors übertreffen.
analogsystemsrf
2020-07-27 13:02:01 UTC
view on stackexchange narkive permalink

Wärmeabfuhr ist das Problem.

Einige Chips haben bereits eine höhere Energiedichte als ein Kernreaktor.

Betrachten Sie einen Haartrockner ---- 1.500 Watt mit einem Air_blast-Lüfter, um die Wolframspulen zu kühlen.Und die Spulen leuchten matt rot.

Leistungsdichte sicher.Das heißt, sie haben auch eine höhere Leistungsdichte als die Sonne, oder?
"Kernreaktor" bezieht sich in diesem Zusammenhang auf eine kontrollierte ** Spalt ** -Reaktion.Ein ** Fusions ** -Reaktor wäre mit der Sonne vergleichbar - aber Stromkreise mit vergleichbaren Leistungsniveaus würden nicht lange halten.
[Anscheinend] (https://physics.stackexchange.com/questions/370899/suns-power-density-compared-to-a-compost-heap) ist die Leistungsdichte der Sonne nicht wirklich beeindruckend
@ManfP Ja, aber es kann 10 Milliarden Jahre dauern, also ist das etwas ...
@J ... das ist praktisch, weil es jedes Mal schmilzt, wenn Sie mit einem USB-Ladekabel in die Nähe kommen.
@user253751 Ihr eigener Körper hat eine höhere Leistungsdichte als die Sonne.
Felix S
2020-07-27 13:00:52 UTC
view on stackexchange narkive permalink

Aber was würden Sie davon bekommen?

  1. Die Anzahl der Transistoren pro mm² Maske, die Sie erhalten, ist immer noch gleich. Sie hätten nur mehr Masken
  2. Die Ausrichtung mehrerer Masken ist umso schwieriger, je mehr Masken ausgerichtet werden müssen.
  3. Sie benötigen wahrscheinlich mehrere zusätzliche Verbindungsschichten für jede zusätzliche Transistorschicht
  4. Das Herstellen einer Verbindung zwischen Ebenen ist aufwändiger als das Herstellen einer Verbindung innerhalb einer Ebene.
  5. Wärmeableitung wäre schlechter
  6. ol>
Einige Computer, z.https://en.wikipedia.org/wiki/Titan_(supercomputer) haben 3D-Verbindungstopologien verwendet, sodass der Abstand zwischen vielen Knoten geringer ist.1023 Kerne auf übereinander gestapelten 50-μm-Wafern hätten einen weitaus geringeren Abstand als ein 2D-Gitter mit 32 Kernen pro Seite, das ausreicht, um GHz-Uhren usw. zu teilen.
pjc50
2020-07-27 13:41:14 UTC
view on stackexchange narkive permalink

Transistoren sind in der unteren Schicht viel einfacher herzustellen, da die traditionelle Struktur "n-Well" - oder "p-Well" -Strukturen umfasst.

Auch: Planarisierung.

Die untere "Substrat" -Schicht wird mechanisch auf einen sehr hohen Grad an Ebenheit poliert.Nachfolgende Schichten oben werden geätzt und abgeschieden, aber jedes Mal ist es nicht perfekt.Es besteht die Gefahr von Fehlern, die dazu führen, dass Features auf einem "Klumpen" in der Oberfläche nicht richtig ausgerichtet werden.

Overmind
2020-07-27 15:51:55 UTC
view on stackexchange narkive permalink

Es gibt zwei Hauptgründe:

  1. Wärmeableitung - dies erfordert Kontaktfläche. Diese Oberfläche überträgt Wärme von der CPU auf das Kühlsystem. Wenn es sich um 3D handelt, wird es extrem schwierig, Wärme aus den Unterschichten abzuleiten, da die Kontaktfläche erheblich geringer wäre als zur Aufrechterhaltung des Wärmeübergangs erforderlich.

  2. Erträge - sie sind in vielen Fällen sowieso niedrig. Als nVidia die GTX 285/295 ausprobierte, hatten sie Anfangsausbeuten von unter 2% und nach Prozessstabilisierung lagen sie immer noch unter 10%. Das bedeutete, dass sie Teile des Chips abschneiden mussten, um aus dem verbleibenden guten Teil Karten der unteren Klasse zu machen. Und das mit einem Standard-2D-Prozess, der nur übergroß war. Der Versuch, etwas in 3D zu bringen, hätte noch geringere Erträge, wenn wir den Heizteil ignorieren würden.

  3. ol>

    Darüber hinaus ist eine vollständige Anpassung des Fab-Prozesses (vorausgesetzt, alles andere ist in Ordnung) nicht das, was viele bereit wären, einfach weiterzumachen, während die aktuelle Technologie mehr zu bieten hat.

    HBM Memory hat es geschafft, Dinge in Stapeln zu erledigen. Es ist nicht wirklich 3D, es wurde 2.5D genannt, weil es nur wenige Schichten hat und es ist eine teure Lösung. Die Paketgröße ist groß und mit Wärmemanagementproblemen verbunden (selbst wenn die erzeugte Wärme im Vergleich zu CPUs erheblich geringer ist). Die fortschrittliche Chipverpackungstechnologie, die DRAM-Chipchips mithilfe von Elektroden, die die mikrometerdicken Chips durch mikroskopische Löcher durchdringen, vertikal verbindet, hat in diesem Fall Abhilfe geschaffen.

HBM - viele schöne Stapel- / Interposer-Bilder online verfügbar.In anderen Antworten werden auch NAND-Flash-Speicher nicht erwähnt - diese sind in großem Umfang vertikal verlaufen, wobei [128 Zellenschichten vertikal gestapelt] sind (https://www.google.com/search?q=128+layer+nand+)Blitz + Querschnitt + Schnitt).Da möglicherweise nur 1 der 128 aktiv ist, ist die Hitze kein Problem.
NANDs verarbeiten nicht kontinuierlich mit den meisten ihrer "Zellen", so dass dies aus der Sicht der Wärme recht gut sein kann.
user5216459
2020-07-29 18:37:34 UTC
view on stackexchange narkive permalink

Die Sache ist, dass die Wissenschaftler von heute nicht verstehen, warum es heiß wird, selbst wenn bestimmte Energien angewendet werden, um ein bestimmtes Ergebnis zu erzielen.

Es ist alles auf das Quantenenergiepotential zurückzuführen, um das Umdrehen eines Transistors (überlastet / unterlastet) zu erreichen, den sie aufgrund universeller Kräfte, die auf Ihren Chip wirken, obwohl er abgeschirmt ist, nicht perfektionieren können. Die Kräfte interagieren immer noch Mit diesen Potentialen sind diese Wechselwirkungen bestenfalls zu erraten und scheinen ihr Denken nicht zu berücksichtigen. Energieverschwendung wird von allen Achsen der Geometrie abgegeben und nicht direkt auf dem Weg des geringsten Widerstands, auch nicht von den Harmonischen der Substanz, die die Energie ist Das Durchlaufen ist geometrisch nicht perfekt, aber das ist nur ein weiteres Problem.

Ich schweife ab, 3D-Stapeln würde Zwischenabfallsammler erfordern, die die Abfällenergie aus dem Chip absorbieren, anstatt den Abfall passiv zu extrahieren.

Stellen Sie sich vor, jeder Transistor wird durch zeitliche Schwankungen überlastet, die beim Aufbrechen einer Funkenstrecke eine Emission wie ein Kraftwerk verursachen. Die Energie muss irgendwohin gehen, bevor die Verbindung bei der ersten Verbindung unterbrochen wird, aber da dies nicht der Fall ist, ist dies der Transistor verursacht eine Emission, die die Energie in Form von Wärme ausstrahlt, aufgrund des spontanen Absturzes von Abfallenergie, die versucht, den Transistor auszulösen, aber nicht kann, und so wird sie reflektiert oder die Energie kollidiert einfach weiter mit der Geometrie der CPU, bis sie leer ist Energie und jedes Mal, wenn sie reflektiert wird, bricht sie zusammen und gibt Wärme ab.

Der Trick besteht darin, eine Trickle-Down-Verarbeitung wie ein Kartenstapel in einem Dreieck durchzuführen. Jede Nase in dieser Kartenpyramide wird von Anfang bis Ende verfolgt, und die verbleibende Energie wird an einen anderen Prozessor abgegeben, der nur zum FÜLLEN da ist ANFORDERUNGEN an die Absorption der Abfallenergie, falls vorhanden.

Der Grund, warum Sie möchten, dass ein anderer Prozessor die Abfallenergie aufnimmt, liegt darin, dass die Energie sich auflösen und auf natürliche Weise arbeiten muss. Der Weg des geringsten Widerstands findet auf vielen Skalen und Formen statt. Das Timing ist sehr wichtig. Je schneller Ihre Uhr ist, desto mehrZeit müssen Sie mit der Energie spielen, die Sie haben.

Ich würde gerne von der Person hören, die meinen Kommentar abgelehnt hat, und versuchen, etwas anderes zu erklären, und wenn sie überhaupt abgelehnt haben, aber ich bezweifle kaum, dass ich von ihnen hören werde.
Ich bin nicht derjenige, der Sie herabgestimmt hat, aber Ihre Antwort enthält einige Dinge, die einfach keinen Sinn ergeben oder einfach falsch sind.Energie kracht gegen Transistoren?Energie, die keine Transistoren auslöst?Energie zusammenbrechen?Und die Hitze kommt davon?Die Leute verstehen heute nicht, warum es heiß wird?Schnelleres Takten reduziert den Energieverbrauch?
Was sind "Abfallsammler"?Dies ist kein Standard-EE-Begriff, und Sie erklären nie, was sie sind oder wie sie funktionieren.Gleiches gilt für "Trickle Down Processing".Eine gute Antwort sollte für andere verständlich sein, indem nach Möglichkeit Standardterminologie verwendet und Begriffe definiert werden, wo dies nicht der Fall ist.
Nun, die Antwort ist inkohärent.Wenn es versucht, etwas zu sagen, versucht es, zu viel mit zu wenig zu sagen.


Diese Fragen und Antworten wurden automatisch aus der englischen Sprache übersetzt.Der ursprüngliche Inhalt ist auf stackexchange verfügbar. Wir danken ihm für die cc by-sa 4.0-Lizenz, unter der er vertrieben wird.
Loading...