|
Dieser Artikel enthält mathematische Zeichen, die in der Tabelle mit mathematischen Symbolen erklärt werden.
Hidden Markov Models oder meist kurz HMMs sind stochastische Modelle, die auf Markow-Ketten beruhen. Die Symbole in der beobachteten Ausgabesequenz sind dabei
von der Markow-Kette entkoppelt, indem zusätzlich zu den Übergangswahrscheinlichkeiten für die internen (versteckten,
hidden) Zustände noch Emissionswahrscheinlichkeiten für die Ausgabesymbole in Abhängigkeit von dem internen Zustand in
das Modell einfließen.
| Inhaltsverzeichnis |
|
1 Veranschaulichung
2 Beispiel
3 Formales Modell
4 Anwendungsgebiete
5 Weblinks
|
Veranschaulichung

Es bedeuten:
- x - (versteckte) Zustände des Markow-Modells
- a - Übergangswahrscheinlichkeiten
- b - Emissionswahrscheinlichkeiten
- y - (sichtbare) Ausgabesymbole
Beispiel
Ein Gefangener im Kerkerverlies möchte das Wetter kennen. Er weiß, dass auf einen sonnigen Tag zu 70% ein Regentag folgt und
dass auf einen Regentag zu 50% ein Sonnentag folgt.
Weiß er zusätzlich, dass die Schuhe der Wärter bei Regen zu 90% dreckig, bei sonnigem Wetter aber nur zu 60% dreckig sind, so
kann er aus Beobachtung der Wärterschuhe Rückschlüsse über das Wetter ziehen.
Formales Modell
Formal definiert man ein HMM üblicherweise in folgender Notation:
S1...SN, Vektor von N Zuständen.
? = {v1...vM}, diskretes Emissionsalphabet über
M Symbole.
? = (?1...?N), Vektor mit Startwahrscheinlichkeiten. ?i ist die Wahrscheinlichkeit im ersten Zeitschritt im Zustand Si zu sein.
A = {aij}, Matrix der Übergangswahrscheinlichkeiten wobei
aij die Wahrscheinlichkeit angibt von Zustand Si zu Zustand Sj zu wechseln.
B = {bij}, Matrix der Emissionswahrscheinlichkeiten,
bij steht für die Wahrscheinlichkeit das Symbol vj in Zustand Si zu erzeugen.
? = (A,B,?), vollständiger Parameter Vektor.
Anwendungsgebiete
Mustererkennung, Gen-Vorhersage in der Bioinformatik, Computerlinguistik (insbes. Spracherkennung), Zeitreihenanalyse
Zum Beispiel kann beim computergestützten Lesen von Handschriften mit
dieser Methode das Wort in seiner Gesamtheit erfasst werden und nicht Buchstabe für Buchstabe. Die Buchstaben sind bei
Schreibschrift oft schwer trennbar.
Weblinks
- http://www.ghmm.org eine HMM C-Bibliothek, die
unter der LGPL frei verfügbar ist
|