Markus Hauenstein

Physiologie des Gehörs

Physiologie des Gehörs

 

 

Mit Hilfe seiner Sinnesorgane tritt der Mensch mit seiner Umwelt in Kontakt. Das wichtigste Sinnesgebiet nach dem Sehen ist das Hören, also die Wahrnehmung von Schallwellen. Schallwellen transportieren in einem vermittelnden Medium (Luft) in Form von longitudinalen Wellen Energie und lösen beim Menschen Geräusch, Klang- oder Tonempfindungen aus. Die Modellierung der menschlichen Gehörvorgänge spielt bei der digitalen Sprach- und Audiosignalverarbeitung eine wichtige Rolle.

Physiologie des Gehörs - Weiterer Inhalt:

 

Das Gehör

oben

Das Sinnesorgan zur Wahrnehmung von Schallwellen ist beim Menschen wie auch bei höherentwickelten Tieren das Ohr. Man untergliedert das Ohr in die drei Abschnitte Außenohr, Mittelohr und Innenohr.

Hier erhalten Sie eine schematische Darstellung des Gehörs.

 

Das Außenohr

oben

Das Außenohr besteht aus der Ohrmuschel und dem Gehörgang. Im Zusammenspiel mit Kopf, Schulter und Oberkörper bewirkt die Formgebung der Ohrmuschel eine Richtungscharakteristik, so daß von vorne eintreffende Schallwellen bevorzugt werden. Der Gehörgang leitet die durch die Ohrmuschel aus dem äußeren Schallfeld aufgenommenen Schallwellen weiter zum Trommelfell. Das Trommelfell schließt den Gehörgang ab und bildet den Übergang zum Mittelohr. Die Zuführung des Schalls durch den Gehörgang schützt das Trommelfell vor äußeren Einflüssen und erlaubt eine möglichst nahe Positionierung des Innenohrs am Gehirn, um durch kurze Nervenwege einen schnellen Informationsfluß zu erzielen. Die Aufnahme von Schallwellen durch das Trommelfell funktioniert besonders gut bei Frequenzen um 3.5 kHz, da hier die Länge des Gehörgangs von rund 24 mm in etwa einem Viertel der Wellenlänge entspricht.

 

Das Mittelohr

oben

Die eigentlichen Sinneszellen zur Schallwahrnehmung befinden sich im Innenohr, welches mit Lymphflüssigkeit gefüllt ist. Der durch Außenohr und Gehörgang antransportierte Luftschall (kleine Kräfte und große Auslenkungen) muß also zur Anregung der Sinneszellen in Flüssigkeitsschall (große Kräfte und kleine Auslenkungen) umgewandelt werden. Das Mittelohr bildet den Transformator zur Anpassung des Schallwellenwiderstands in Luft an den in der wasserähnlichen Lymphe. Die Schallwellen erreichen durch den Gehörgang das Trommelfell und versetzen dieses in mechanische Schwingungen. Diese Schwingungen werden über die drei Gehörknöchelchen Hammer (Malleus), Amboß (Incus) und Steigbügel (Stapes) an das ovale Fenster des Innenohrs weitergeführt. Die Gehörknöchelchen bewirken eine Hebelübersetzung, indem ihr längerer Hebelarm auf der Eingangsseite (Richtung Außenohr) und ihr kürzerer Arm auf der Ausgangsseite (Richtung Innenohr) liegt. Große Auslenkungen und kleine Kräfte werden so auf große Kräfte und kleine Auslenkungen abgebildet. Weiterhin wird das Flächenverhältnis von Trommelfell (ca. 55 mm2) und ovalem Fenster (ca. 3.2 mm2) zur Drucktransformation ausgenutzt. Im Frequenzbereich um 1 kHz wird durch diese beiden Mechanismen eine fast ideale Anpassung der Wellenwiderstände von Luft und Lymphe erzielt.

Die Schallübertragung im Mittelohr kann durch zwei Muskeln beeinflußt werden: Der Muskulus tensor tympani kann den Hammerstiel etwas nach innen ziehen, und der Muskulus stapedius kann den Steigbügel durch eine Kippbewegung ein wenig aus dem ovalen Fenster herausziehen. Bei hohen Schallpegeln werden diese beiden Muskel aktiv und setzen die Übertragungsfähigkeit des Mittelohrs herab. Das Innenohr wird so vor zu hohen Pegeln geschützt.

Bei Änderung des äußeren Luftdrucks verschiebt sich die Ruheposition des Trommelfells und damit der Arbeitspunkt der Mittelohrkette. Um der hierdurch bedingten Verschlechterung des Übertragungsverhaltens entgegenwirken zu können, ist der Mittelohrraum über die Eustachische Röhre mit dem Rachen verbunden. Diese normalerweise geschlossene Verbindung wird bei Luftdruckänderung kurzzeitig geöffnet, um einen Druckausgleich herzustellen. So gelangt das Trommelfell wieder in seine Normalpostion zurück und der optimale Arbeitspunkt der Mittelohrkette wird wiederhergestellt.

 

Das Innenohr

oben

Das Innenohr des Menschen befindet sich innerhalb eines sehr harten Knochens, dem sogenannten Felsenbein. In der Cochlea (Schnecke) vollzieht sich die eigentliche akustische Sinnesaufnahme, hier werden die mechanischen Schallschwingungen in elektrische Aktionspotentiale umcodiert. Das Innenohr dient aber nicht nur als Schallempfänger, sondern auch als Gleichgewichtsorgan des Menschen: Der Vestibularapparat ist für die Aufnahme aller Formen von Beschleunigungsreizen zuständig. Linearbeschleunigungen werden mit Hilfe der Statolithenorgane und Drehbeschleunigungen durch die Bogengangsorgane erkannt. Der Vestibularapparat ist ebenfalls mit Lymphflüssigkeit gefüllt, welche mit der Lymphe in der Cochlea in Verbindung steht. Unter den Sinnesorganen ist diese Vereinigung zweier verschiedener Organe im Innenohr einzigartig.

Hier erhalten Sie eine Schematische Darstellung der (aufgerollten) Cochlea und des Cochlea-Querschnitts. Das Volumen der Cochlea beträgt etwa 1 cm3.

Die menschliche Cochlea besitzt ungefähr zweieinhalb Windungen und wird der Länge nach in zwei etwa gleich große Halbräume geteilt. Die Trennung der beiden Halbräume der Schnecke erfolgt zunächst über eine knöcherne Trennwand und wird fortgesetzt durch die hydromechanisch bedeutungsvolle und etwa 32 mm lange Basilarmembran, welche am Schneckeneingang sehr schmal ist und sich über die Länge der Schnecke bis auf das Dreifache verbreitert. Der eine Halbraum wird als Skala tympani bezeichnet. Der zweite Halbraum wird durch die sehr dünne und für hydromechanische Betrachtungen vernachlässigbare Reissner-Membran weiter unterteilt in zwei Kammern, welche als Skala media und die Skala vestibuli bezeichnet werden. Insgesamt besitzt die Cochlea damit drei parallel verlaufende Skalen. Die Reissner-Membran setzt schon an der knöchernen Trennwand an und trennt die Basilarmembran von der Skala vestibuli ab. Die vergleichsweise kleine Skala media bildet so einen von der Umgebung völlig abgeschotteten Bereich. Unterschiedliche Ionenkonzentrationen in der Skala media (Endolymphe, hoher Kaliumgehalt) auf der einen Seite und innerhalb der Skala vestibuli und Skala tympani auf der anderen Seite (Perilymphe, hoher Natriumgehalt) sorgen für ein gegenüber der Umgebung um ca. 80 mV angehobenes Potential innerhalb der Skala media. Die beiden Halbräume der Cochlea sind allerdings nicht vollständig voneinander getrennt: Am Ende der Schnecke befindet sich ein Durchbruch, das sogenannte Helicotrema, welches die Skala vestibuli mit der Skala tympani verbindet. Die verfügbaren Abbildungen zeigen einen Schnitt durch eine reale nicht aufgerollte Cochlea und einen gemalten Schnitt durch die aufgerollte Schnecke.

Hier erhalten Sie einen Querschnitt durch die Cochlea. Sie sehen die drei Kanäle Skala vestibuli, Skala media und Skala tympani sowie das Helicotrema.

Das ovale Fenster bildet die Schnittstelle zwischen dem Mittelohr und dem Innenohr: Die Fußplatte des Steigbügels liegt am ovalen Fenster an und leitet so die Schallschwingungen an die Flüssigkeit innerhalb der Skala vestibuli weiter. Die Lymphflüssigkeit und das umgebende Knochenmaterial sind inkompressibel, daher findet der nötige Druckausgleich über das runde Fenster statt, welches sich am eingangsseitigen Abschluß der Skala tympani befindet.

Hier erhalten Sie einen Querschnitt durch die aufgrollte Cochlea. Sie sehen die drei Kanäle Skala vestibuli, Skala media und Skala tympani sowie die Basilarmembran mit Cortischem Organ.

 

Wellenausbreitung auf der Basilarmembran

oben

Die Schallwellen werden über Außen- und Mittelohr an das ovale Fenster übertragen. Sie breiten sich in der Innenohrflüssigkeit aus, und die Basilarmembran wird zu Schwingungen angeregt. Die Schwingungsform der Basilarmembran entspricht bei Anregung mit einem reinen Ton einer Wanderwelle: Ausgehend vom ovalen Fenster steigt die Hüllkurve der vertikalen Schwingung der Basilarmembran langsam an und erreicht ein Maximum, danach fällt die Hüllkurve steil ab in Richtung Helicotrema, und die Wellenausbreitung hat ein Ende. Der Ort des Amplitudenmaximums ist nichtlinear, aber monoton abhängig von der Frequenz des Tones: hohe Frequenzen werden abgebildet auf einen Ort nahe dem ovalen Fenster (hier ist die Basilarmembran schmal und steif) und niedrige Frequenzen auf einen Ort nahe am Helicotrema (hier ist die Basilarmembran vergleichsweise breit und schlaff). Auf der Basilarmembran findet also eine Frequenz-Orts-Transformation statt, welche die Fähigkeit des Innenohrs zur Frequenzanalyse erklärt: Die Energie von Signalkomponenten unterschiedlicher Frequenz wird auf unterschiedliche Orte der Basilarmembran übertragen und erregt die dort befindlichen Haarzellen. Die untere Abbildung verdeutlicht die Zusammenhänge.

Hier sehen Sie die Ausbreitung von Wanderwellen auf der Basilarmembran für drei reine Töne unterschiedlicher Frequenz. Zu einer bei Sprache gängigen Schallintensität von 60 dB gehören Auslenkungen von etwa 10^-10m.

Die Cochlea kann damit, wie in der Abbildung dargestellt, als Filterbank interpretiert werden: Betrachtet man die Basilarmembran als ein eindimensionales schwingfähiges Gebilde, so kann man die Schwingung eines bestimmten Punktes durch das Ausgangssignal eines geeignet gewählten Filters modellieren. Die Filterform (insbesondere die Mittenfrequenz) ist dabei von der Lage des Punktes abhängig. Modelliert man mehrere Punkte gleichzeitig, erhält man eine Filterbank. Das Eingangssignal der Filterbank entspricht dabei der Schwingung des ovalen Fensters. Häufig interessiert aber nicht der genaue Schwingungsverlauf der Basilarmembran, sondern die hierdurch mittelbar verursachte Erregung der Hörrezeptoren, welche sich auf der Basilarmembran befinden. Diese Erregung kann wie die Schwingung selbst mit Hilfe einer Filterbank modelliert werden. Die genauen Filterformen kann man durch psychoakustische Maskierungsexperimente ermitteln. Alternativ kann das Potential in den Hörrezeptoren, welches ebenfalls mittelbar von der Basilarmembranschwingung abhängt, direkt gemessen werden und zum Entwurf einer Filterbank benutzt werden. Hierbei werden z.B. die Impulsantworten der Filter bestimmt.

Hier sehen Sie eine Darstellung der Cochlea als Filterbank: In diesem vereinfachten Beispiel modellieren fünf Filter fünf äquidistante Punkte auf der Basilarmembran. Die Laufzeit bis zur Mitte (zum Ende) der Cochlea beträgt etwa 1.5 ms (5 ms).

 

Cortisches Organ und Haarzellen

oben

Auf der Basilarmembran liegt das aus einer gallertartigen Masse bestehende Cortische Organ, in welchem sich die eigentlichen Hörrezeptoren befinden. Die Sinneszellen besitzen Haarfortsätze und werden daher auch als Haarzellen bezeichnet. Eine aus Fibrillen aufgebaute Deckmembran (Membrana tectoria) schließt das Cortische Organ nach oben ab. Zwischen den Haarzellen und der Deckmembran befindet sich der etwa sechs Mikrometer hohe und mit einer Flüssigkeit gefüllte subtektorische Zwischenraum, in welchen die Haarfortsätze hineinragen. Jede Haarzelle besitzt mehrere Haarfortsätze, wobei die äußeren (d.h. von der knöchernen Trennwand weiter entfernten) Haare länger sind als die inneren. Die kurzen Haare bewegen sich frei in der Flüssigkeit und berühren die Deckmembran nicht. Die längeren Haare aber berühren die Deckmembran oder sind in ihr verankert. Makromoleküle verbinden die Haare miteinander.

Am unteren Bereich der Haarzellen greifen die Nervenfasern an, welche die Informationsübertragung zwischen Haarzellen und Gehirn bewerkstelligen. Die Haarzellen sind in einer Reihe innerer Haarzellen und drei Reihen äußerer Haarzellen angeordnet. Insgesamt gibt es rund 20000 Haarzellen. Innere Haarzellen (ihre Anzahl beträgt in etwa 3600) und äußere Haarzellen haben eine unterschiedliche Funktion, wie aus ihrer Versorgung mit Nervenzellen geschlossen werden kann: An den inneren Haarzellen enden 95 Prozent aller afferenten Nervenfasern (diese transportieren Informationen vom Gehör zum Gehirn), wobei jede innere Haarzelle mit bis zu 20 Fasern in Kontakt steht. Jede afferente Faser endet hierbei in nur einer inneren Haarzelle. Umgekehrt ist die efferente Innervation (efferente Nervenfasern transportieren Information vom Gehirn in Richtung Haarzellen) der äußeren Haarzellen wesentlich größer als die der inneren Haarzellen. Man vermutet daher, daß über einen Rückkoppelmechanismus die äußeren Haarzellen auf die inneren einwirken [Fastl90]. Die inneren Haarzellen stellen also die eigentlichen Hörrezeptoren dar.

Hier erhalten Sie ein Bild des Cortischen Organs (zur Verdeutlichung wurden die in der ursprünglichen Aufnahme nicht sichtbaren Haarfortsätze der Haarzellen nachträglich eingezeichnet).

 

Mechanisch-elektrische Umwandlung

oben

Die Basilarmembran und die Deckmembran sind beide an der knöchernen Trennwand befestigt. Wenn eine dem Schall entsprechende Druckwelle sich im Innenohr fortpflanzt, werden beide Membranen zu Auf- und Abbewegungen angeregt. Hierbei werden die Haarfortsätze aufgrund einer Scherwirkung bzw. aufgrund der im subtektorischen Zwischenraum entstehenden Flüssigkeitsströmung geknickt, was zur Aktivierung der Sinneszellen führt. Die Sinneszellen werden zur Abgabe von Neurotransmittersubstanz (ein Botenstoff, der eine Übertragung oder Weiterleitung von nervöser Erregung ermöglicht) angeregt, welche sogenannte Aktionspotentiale in den Nervenfasern auslöst: Die Nervenzellen 'feuern'. Die inneren Haarzellen können also als eine Art Mikrofon verstanden werden. Anders als bei normalen elektroakustischen Wandlern bleibt hier die Wellenform der Signale jedoch nicht erhalten, denn die mechanischen Schwingungen werden in eine elektrische Impulsfolge übersetzt.

Die Umwandlung der mechanischen Reize in elektrische Nervenimpulse kann wie folgt erklärt werden [Allen85, Allen77]: Durch die Bewegung der steifen Haarfortsätze ändert sich der elektrische Widerstand des oberen Zelldachs, in welchem die Haarfortsätze verwurzelt sind. Da durch biologische Prozesse eine Spannung von ca. 120 bis 140 Millivolt über den gesamten Zellkörper konstant gehalten wird, moduliert diese Widerstandsänderung den Stromfluß durch die Zelle und damit das Potential im Zellinneren (das sogenannte Rezeptorpotential). Diese zellinterne Spannungsänderung moduliert ihrerseits die Öffnung von Calciumkanälen, welche sich im unteren Teil der Zelle befinden. Calciumionen strömen ins Zellinnere und bewirken, daß sich in der Zelle vorhandene kleine Trägerkörper von Neurotransmittersubstanz mit der Zellmembran verbinden. Geschieht dieses an einer Verbindungsstelle von innerer Haarzelle und Nervenfaser, also an der Synapse, so wird die Neurotransmittersubstanz in den subsynaptischen Spalt ausgeschüttet: ein sogenanntes Generatorpotential bildet sich und löst ein Aktionspotential aus, welches sich in der Nervenfaser fortpflanzt.

Mit steigendem Schalldruckpegel nimmt die Schwingungsamplitude der Haarfortsätze und damit die Schwankung des Ruhepotentials zu. Die Calciumkanäle öffnen sich weiter, und eine Zunahme der Calciumionenkonzentration im Zellinneren bewirkt eine größere Menge an ausgeschütteter Neurotransmittersubstanz im subsynaptischen Spalt. Damit steigt die Wahrscheinlichkeit, daß ein Aktionspotential ausgelöst wird. Es ergeben sich also mit steigendem Schalldruckpegel mehr Impulse pro Zeiteinheit. In Abhängigkeit von der Erregung der Haarzellen können minimal etwa 20 (Spontanaktivität, d.h. Aktivität ohne äußere Erregung) bis maximal etwa 300 (Sättigung) Aktionspotentiale in den einzelnen Nervenfasern beobachtet werden. Der Übergang von der Spontanaktivität in die Sättigung korrespondiert mit einer Erhöhung der Schallintensität von ungefähr 40 dB. Da die einzelnen Fasern jedoch unterschiedliche Empfindlichkeiten aufweisen, kann insgesamt eine größere Dynamik erzielt werden. Im Zusammenspiel mit einer nichtlinearen Kompression innerhalb der Cochlea wird so die Verarbeitung von Schallintensitäten in einem Bereich von mehr als 100 dB möglich.

 

Nichtlineare Kompression

oben

Bei den Haarfortsätzen beträgt das Verhältnis der maximalen Schwingungsamplitude (Sättigung) und der minimalem Schwingungsamplitude (thermisches Rauschen) etwa 1000, während hörbare Schallamplituden einen Dynamikbereich von rund 10^6 besitzen (zwischen Hörschwelle und Schmerzgrenze). Innerhalb der Cochlea muß also neben der Trennung von Frequenzkomponenten auch eine nichtlineare Kompression der Signalamplituden stattfinden, wobei aber der Informationsinhalt der Signale nicht wesentlich reduziert wird. Eine mögliche Erklärung [Fastl90] für diese Dynamikkompression liegt in einem aktiven Rückkoppelmechanismus, in welchem die äußeren Haarzellen eine wesentliche Rolle spielen und auf die inneren Haarzellen einwirken. In der unteren Abbildung wird dieses Konzept dargestellt. An einem bestimmten Ort auf der Basilarmembran wird durch die Schwingung eine innere Haarzelle erregt. Über einen Summationspunkt und ein Phasenglied gelangt diese Erregung ebenfalls zu einer äußeren Haarzelle, welche als Verstärker mit Sättigungscharakteristik wirkt (die Sättigung wird bei einer Erregung entsprechend einem Schalldruckpegel von etwa 30 dB erreicht). Eine einzelne innere Haarzelle kann von vielen äußeren Haarzellen in ihrer Umgebung beeinflußt werden. Dieser Einfluß könnte auf mechanische, elektrische oder chemische Art und Weise (oder einer Kombination davon) vermittelt werden. Bei höheren Pegeln jedoch gelangen die verstärkenden äußeren Haarzellen in die Sättigung, und ihr Einfluß auf die inneren Haarzellen kann gegenüber der äußeren Erregung vernachlässigt werden. Weiterhin wirken die äußeren Haarzellen (über ein Dämpfungsglied und das Phasenglied) auf sich selbst zurück. Durch diese Rückkopplung wird die auf die äußeren Haarzellen einwirkende Erregung frequenzselektiv (bei entsprechender Wahl der Phasencharakteristik) beträchtlich verstärkt.

Hier erhalten Sie ein Darstellung, welche die Rückwirkung der äußeren auf die inneren Haarzellen verdeutlicht.

Bei einem solchen Rückkoppelmechanismus besteht die Gefahr der Selbsterregung, außerdem entstehen aufgrund der nichtlinearen Verstärkungskennlinie nichtlineare Verzerrungen (Klirren) im Ausgangssignal. Da der Rückkoppelmechanismus auf die Schwingung der Basilarmembran anscheinend rückwirkt, können diese beiden Effekte tatsächlich beobachtet werden: Otoakustische Emissionen sind Schalle (im allgemeinen unterhalb der Hörbarkeitsgrenze), welche vom Gehör selbst erzeugt werden und als (kurzzeitige) Selbsterregung des Rückkoppelmechanismus interpretiert werden können. Die Nichtlinearitäten des Gehörs werden besonders bei Darbietung von zwei reinen Tönen unterschiedlicher Frequenz bemerkt, da hier (deutlicher) hörbare Differenztöne entstehen.

 

Informationsfluß zum Gehirn

oben

Die durch Erregung der Haarzellen ausgelösten Nervenimpulse gelangen über den für Hör- und Gleichgewichtsinformationen zuständigen achten Gehirnnerven (Nervus statoacusticus), das verlängerte Rückenmark (Medulla oblongata) und den Thalamus zur Großhirnrinde, wo die Heschlsche Querwindung im Schläfenlappen das Hörzentrum bildet. Hier wird die eigentliche Hörempfindung gebildet. Die peripher in der Cochlea durchgeführte Frequenz-Orts-Transformation findet sich in der Großhirnrinde wieder (tonotopische Organisation). Auf diesen höheren Ebenen der Schallwahrnehmung wird durch den Vergleich der von beiden Ohren angelieferten Signale auch eine Lokalisation der Schallquelle möglich (Richtungshören), indem unterschiedliche Lautheiten und geringe zeitliche Differenzen ausgewertet werden.


This article is copyrighted.