Die räumliche Lokalisierung einer Schallquelle geht auf einen Lernprozess zurück, der mit der Geburt einsetzt. Akustische Signale werden vom Körper und durch die individuelle Form der Ohrmuschel abgeleitet, bevor sie den Gehörgang erreichen daran anschließend über eine feine knöcherne Hebelmechanik (Hammer, Amboß, Steigbügel), die an die Membrane Trommelfell anschließt, über Sinneshärchen in den Bogengängen der sogenannten „Schnecke“ in elektrische Signale von Nervenzellen umgewandelt.

Die Schallwellen setzen dabei die Flüssigkeit, mit der diese Gänge gefüllt sind, in Bewegung. Sinneshärchen unterschiedlicher Größe reagieren auf unterschiedliche Frequenzen: Feine Härchen sind für hohe Töne, dickere für niedrige Frequenzen zuständig. Die feinen Sinneshärchen sind naturgemäß empfindlicher, können durch zu laute akustische Signale daher leichter beschädigt werden und sind auch dem Alterungsprozeß des Organismus stärker unterworfen als die dickeren Härchen, weshalb Kleinkinder noch Frequenzen bis zu 18kHz und mehr wahrnehmen können, mit fortschreitendem Alter die Obergrenze aber unter 8 kHz fällt.

Durch das Ableiten des Schalls über den Körper und die Ohrmuschel kommt es zu charakteristischen Laufzeitunterschieden der Schallwellen, die sich in Streuungen niederschlagen, sowie zu Intensitäts- bzw- Lautstärkeabweichungen und Färbungen des Frequenzspektrums in Abhängigkeit von der relativen Position der Schallquelle zu Hörer. Was im Ohr ankommt, klingt also nicht so wie das Originalsignal der Schallquelle, sondern beinhaltet eine individuelle Prägung – es sei denn, die Schallquelle sitzt direkt vor dem Gehörgang. In diesem Fall wird die Schallquelle ohne Lokalisationsinformationen und als im Kopf befindlich lokalisiert – weshalb Abmischungen über Kopfhörer mit herkömmlicher Technik nicht anzuraten sind.

Das Gehörzentrum lernt, die individuell unterschiedlichen, weil vom Körperbau und der Form der Ohrmuscheln abhängenden, „Verbiegungen“ des akustischen Signals, in eine Lokalisation der Schallquelle umzusetzen – eine komplexe Leistung des Gehirns, die uns als Prozess nicht bewußt wird – wohl aber im Ergebnis.

Bereits mit der Kunstkopfforschung hat man festgestellt, dass räumliches Hören über einen Kopfhörer simuliert werden kann: Einem Styroporkopf wurden Mikrofone in die Ohren gesteckt. Die aufgenommenen Signale konnten später über einen Kopfhörer dreidimensional lokalisiert werden. Die Ergebnisse wurden weiter verbessert, indem man das Oberflächenmaterial des Kunstkopfes hautähnlich gestaltete und einen Torso hinzufügte. Während Kunstkopfaufnahmen eher Randerscheinungen im Musikbereich blieben und in der Automobilindustrie weiterentwickelt wurden, um die Schallwahrnehmung innerhalb eines Cockpits zu testen, eröffnete sich mit dem digitalen Zeitalter die Option, standardisierte Meßergebnisse für eine virtuelle Simulation eines Kunstkopfmikrofons auszuwerten. Man spricht hier von der HRTF-Funktion: Head Related Transfer Function – diese ist die Grundlage der Berechnung des binauralen Zweikanalsignals und geht sowohl bei den oben erwähnten Surround-Kopfhörern als auch bei Plug-Ins wie HEar auf die Aufnahme von Testsignalen über einen Kunstkopf zurück – individuelle Unterschiede (der Körperform) werden hier also nicht berücksichtigt, weshalb die Echtheit des binauralen Erlebnisses von Anwender zu Anwender unterschiedlich ausfällt – der eine liegt näher am Universal-Kunstkopf, der andere vollzieht unbewußt – etwa aufgrund seiner speziellen Ohrmuschelform – eine von der Norm stärker abweichende Interpretation der eintreffenden Schallwellen und kommt möglicherweise mit dem standardisierten Verfahren nicht so gut zurecht.

Um die individuellen Faktoren in die Berechnung des Binauralen Signals mit einzubinden, wurden Verfahren entwickelt, die anstelle eines Kunstkopfes den Kopf des jeweiligen Hörers einsetzt: Zur Erstellung einer persönlichen Binauralen-Encodierung steckt man sich Meßmikrofone in die Ohren. Ein prominentes Beispiel für dieses Verfahren ist der Smyth Research Realiser A8, bei dem zugleich auch die Raumakustik und die Abhöranlage in die Simulation mit eingebunden wird.

Holger Obst