Mustererkennung verfahren

Die Daten, die verwendet werden, um Ablenkung und Müdigkeit zu erkennen, können aus jeder Quelle stammen, müssen aber verwendet werden, um eine Entscheidung über das Vorhandensein oder Fehlen von Unaufmerksamkeit und das Ausmaß der Unaufmerksamkeit zu treffen. Dies kann mit Machine-Learning-Tools erfolgen. Die Entscheidung folgt einem typischen Verfahren eines Mustererkennungssystems (siehe Abb. 4.1). Der erste Schritt besteht darin, die Daten zu sammeln. Die visuellen Daten wie Gesicht und Auge können von Infrarotkameras oder Videokameras erfasst werden. Die biologischen Signale erfordern spezielle Elektroden, die auf den Körper gelegt werden, um die Daten abzurufen. Die rohen Daten, die von jeder Quelle gesammelt werden, sind möglicherweise zu laut, um mit ihnen zu arbeiten. Die Rauschunterdrückung kann mit Bildverarbeitungs- und Signalverarbeitungstechniken erfolgen, die das Signal in der Regel durch einen Bandpassfilter leiten, um die unnötigen Frequenzen zu entfernen, die rauschenden Nein entsprechen.

Das geräuschfreie Signal wird dann aufgenommen. Die Signale können eine Segmentierung erfordern. Im Falle von Bilddaten einer Person, kann man die Augen und Mund für die Ermüdungsanalyse zu extrahieren, die das Problem der Erkennung von individuellen Modalitäten genannt wird. Das segmentierte Bild oder Signal ist im Allgemeinen zu groß, als dass die maschinellen Lerntechniken funktionieren können. Daher wird die Feature-Extraktion verwendet, um die Rohdaten in einige nützliche Features zu konvertieren. Die Funktionen werden dann an ein maschinelles Lernwerkzeug übergeben, das die Aufgabe der Klassifizierung übernimmt. Der Klassifier erzeugt die Endausgabe, d. h. den Zustand des Treibers und den Grad der Unaufmerksamkeit. Die Erfolgsrate im Matching-Prozess hängt stark davon ab, wie nah das Testmuster an einer der Referenzvorlagen ist.

Aufgrund der Verzerrung und des Rauschens, die bei der Handhabung des Testmusters auftreten, kann sich diese gewünschte Ähnlichkeit häufig verschlechtern, so dass der Prozess darunter leiden kann, dass man beginnt, Fehler beim Abgleich zu machen. Zu den möglichen Verzerrungsursachen, die zu signifikanten Abgleichsfehlern führen, wenn sie nicht kompensiert werden, gehören die nichtlinearen Verschiebungen, die in die Zeitskala des Testmusters eingeführt werden. Gesichtserkennung und visuelle Suche gehören zu den beiden topnen Anwendungen für die Bildmustererkennung (IPR). Es ist ähnlich wie OCR, aber anstatt Textzeichen zu erkennen und zu transkribieren, beschreibt es Bilder, so dass sie durchsuchbar werden können. Eine Gruppe von Biologen und Forschern hat an einem der Anwendungen zur Bildmustererkennung zusammengearbeitet – der Tiererkennung in der Mojave-Wüste. Obwohl es von vielen Forschern gezeigt wurde, dass ANNs große Vorteile in der Analyse vieler technischer Anwendungen bieten, sind sie auch dafür bekannt, unter einer Reihe von Nachteilen zu leiden. Eine davon ist, dass die optimale Struktur des Netzwerks (z. B. Anzahl der Eingaben, verdeckte Schichten und Übertragungsfunktionen) von vornherein identifiziert werden muss, was in der Regel durch ein zeitaufwändiges Trial-and-Error-Verfahren erfolgt. Darüber hinaus ist der Hauptnachteil der neuronalen netzwerkbasierten Modelle die große Komplexität der Netzwerkstruktur, da sie das Wissen in Bezug auf eine Gewichtsmatrix darstellt, die für den Benutzer nicht zugänglich ist.

Manchmal fragen die Leute: “Was ist der Unterschied zwischen Mustererkennung und maschinellem Lernen?” Die Antwort ist einfach: Mustererkennung ist eine Art maschinelles Lernen. Beachten Sie, dass manchmal unterschiedliche Begriffe verwendet werden, um die entsprechenden überwachten und unbeaufsichtigten Lernverfahren für die gleiche Art von Ausgabe zu beschreiben.