Grundsätzlich kann man sagen, dass ein Deep-Learning-System aus mehreren Schichten künstlicher Neuronen besteht, die miteinander verbunden sind. Diese Schichten werden als neuronale Netze bezeichnet. Jede Schicht im neuronalen Netzwerk verarbeitet Informationen und gibt diese an die nächste Schicht weiter. Die Eingabeschicht nimmt die Daten auf, die Ausgabeschicht liefert das Ergebnis. Dazwischen liegen versteckte Schichten, die die Daten verarbeiten.
Beim Training ist ein Deep-Learning-System auf eine große Menge an Daten angewiesen, um zu lernen, wie es ein bestimmtes Problem lösen kann. Hierbei verwendet man bei neuen Systemen Erfahrungswerte aus vergleichbaren Systemen, um diese kontinuierlich über die gesamte Laufzeit mit realistischen systembezogenen Daten zu ergänzen. Das Training besteht aus zwei Hauptphasen: der Vorwärts- und der Rückwärtspropagation, sowie historischer und präskriptiver Datenanalyse.
In der Vorwärtspropagation wird das Eingangssignal durch die Schichten des neuronalen Netzes geleitet, wobei jede Schicht die Ausgabe an die nächste Schicht weitergibt. Jede Schicht enthält eine Anzahl von künstlichen Neuronen, die durch mathematische Funktionen miteinander verbunden sind. Diese mathematischen Funktionen transformieren die Eingabe und geben sie an die nächste Schicht weiter. In jeder Schicht werden die Parameter der mathematischen Funktionen so angepasst, dass das System eine bestimmte Aufgabe besser lösen kann.
Nachdem die Daten durch die Schichten des neuronalen Netzes geleitet wurden, wird das Ergebnis mit dem tatsächlichen Ergebnis verglichen. Dieser Vergleich gibt an, wie gut das System bei der Lösung des Problems abschneidet. Basierend auf diesem Feedback wird das System angepasst, und das Training geht in die nächste Runde.
In der Rückwärtspropagation werden Anpassungen an den Gewichtungen und Biases der Neuronen in den Schichten durchgeführt, um das Ergebnis zu verbessern. Dieser Prozess wird iterativ durchgeführt, bis das System eine bestimmte Genauigkeit erreicht hat.
Die Genauigkeit des Deep-Learning-Systems hängt von der Größe und Qualität der Trainingsdaten, der Architektur des neuronalen Netzes sowie von anderen Faktoren ab. Ein gut trainiertes Deep-Learning-System kann beispielsweise in der Bilderkennung eingesetzt werden, um Objekte in Bildern zu identifizieren oder in der Spracherkennung, um menschliche Sprache zu verstehen und zu übersetzen.
Allgemein versetzen Deep-Learning-Systeme Programme in die Lage, komplexe Probleme zu lösen, die mit herkömmlicher Programmierung kaum zu bewältigen sind.