Jednym z czynników znacząco poprawiającym realizm przekazu muzycznego jest stereofonia. W przypadku odtwarzania muzyki równie ważne są: jakość realizacji nagrania, sprzęt odtwarzający oraz środowisko osłuchowe.

Jak to działa.

Możliwość słyszenia dźwięku przestrzennego jest zjawiskiem złożonym. Z jednej strony mamy fizyczne właściwości fali dźwiękowej takie jak np. długość i faza, z drugiej narząd słuchu, wraz z obsługującym go w dość wyrafinowany sposób mózgiem. Słyszenie przestrzenne wykorzystuje różne mechanizmy dla rożnych długości fali dźwiękowej.

W przypadku częstotliwości poniżej 800 Hz wymiary głowy (odległość między uszami 22 cm, co odpowiada opóźnieniu między-usznemu wynoszącemu 64 ms) są mniejsze niż połowa długości fali fal dźwiękowych. Tak więc układ słuchowy potrafi określić opóźnienia fazowe między uszami. Między uszne poziomy głośności są bardzo niskie w tym zakresie częstotliwości, (szczególnie poniżej około 200 Hz) więc precyzyjna ocena kierunku na tej podstawie jest prawie niemożliwa. Gdy częstotliwość spada poniżej 80 Hz, nie da się w ogóle ocenić kierunku źródła dźwięku (rysunek 1).

zakresy działania systemów słyszenia przestrzennego

W przypadku częstotliwości powyżej 1500 Hz wymiary głowy są większe niż długość fal dźwiękowych. Jednoznaczne określenie kierunku wejściowego na podstawie porównania fazy pomiędzy między uszami, nie jest przy tych częstotliwościach możliwe. Jednak różnice głośności stają się dla człowieka lepiej rozpoznawalne i to one są oceniane przez układ słuchowy. Można również ocenić opóźnienia grupowe między uszami i jest ono bardziej wyraźne przy wyższych częstotliwościach. Układ słuchowy wykorzystuje różnicę pomiędzy uszami w dotarciu początku dźwięku, do oceny kierunku. Mózg pobiera z pewną częstotliwością próbki dźwiękowe z otoczenia i potrafi odfiltrować początki dźwięków od ich odbić. Działa to dobrze pod warunkiem, że pogłos otoczenia jest niski, bądź umiarkowany. Dlatego ważna jest adaptacja akustyczna pomieszczeń odsłuchowych. Zbyt duża pogłosowość niszczy spójność przekazu, psuje barwę i przestrzeń nagrań. Słuchając mamy wrażenie dźwiękowego bałaganu.

Tak więc dźwięk przestrzenny tworzony jest przez mózg na podstawie różnic w czasie (różnic dotarcia dźwięku do uszu) dla wyższych częstotliwości i różnicy w fazie dla niższych częstotliwości (na dźwiękach od około 1000 do 1500Hz systemy te działają jednocześnie – rysunek 1). Dodatkowe wskazówki lokalizujące pochodzą od różnic głośności oraz barwy bodźców dźwiękowych (dźwięki cichsze i dźwięki o mniejszej ilości wysokich składowych odbierane są jako dalsze). Mechanizmy opisane powyżej nie mogą być pomocne w rozróżnieniu źródła dźwięku przed słuchaczem lub za nim. W tym zakresie mamy ograniczone możliwości. Opierają się na barwie dźwięku, głośności i ruchach głowy (dźwięki pochodzące z tyłu głowy są przytłumione, maja mniej wysokich składowych, są zniekształcone przez większą ilość odbić od otoczenia, są bardziej zamazane).

Możliwości.

Ludzie mają określone możliwości słyszenia przestrzennego.
Dokładność lokalizacji wynosi 1 stopień dla źródeł przed słuchaczem i 15 stopni dla źródeł po bokach. Ludzie potrafią dostrzec różnice czasu między usznego w najlepszym przypadku do 1ms dla częstotliwości dźwięku około 2kHZ Dla innych częstotliwości nasze możliwości pod tym względem słabną (rysunek 2).

Możliwości lokalizacji kierunku dźwięku przez człowieka.

Dlatego podczas budowy kolumn głośnikowych należy zadbać by opóźnienie grupowe pomiędzy głośnikami średnim i wysokim, nie przekraczało wartości postrzegalnych dla człowieka. Jest to do uzyskania. Dużo trudniej byłoby zadowolić pod tym względem małe zwierzęta, których systemy postrzegania zmian czasowych są czulsze od naszych.

źródło: https://en.wikipedia.org/wiki/Sound_localization

Ssaki o małych głowach i wąskich odstępach uszu lepiej słyszą dźwięki o wysokiej częstotliwości niż ssaki o dużych głowach i szeroko osadzonych uszach. Duże ssaki specjalizują się na ogół w słyszeniu dźwięków o niższej częstotliwości, ponieważ większe czaszki mogą pomieścić dłuższe kanały uszne, błony bębenkowe o większej powierzchni i większą objętość ucha środkowego. Jest to także skorelowane z potrzebami słyszenia określonego zakresu dźwięków. Najważniejsze do usłyszenia dźwięki związane są z komunikacją wewnątrzgatunkową i potrzebą unikania zewnętrznych zagrożeń. Można powiedzieć, że duże ssaki np. słonie potrafią precyzyjnie lokalizować kierunek na podstawie niskich dźwięków i to pochodzących z dużych odległości. Małe zwierzęta np. nietoperze świetnie lokalizują bliskie obiekty wykorzystując do tego aktywny system pracujący na wysokich częstotliwościach (wojna nietoperzy z ćmami).
https://kopalniawiedzy.pl/cmy-nietoperz-mopek-Barbastella-barbastellus-borowiaczek-Nyctalus-leisleri-echolokacja-glosnosc-sygnalu-Holger-Goerlitz-University-of-Bristol,11154

Dlaczego warto?

Jak wskazują badania, ludzki słuch wrażliwy jest na zmiany czasu w zakresie wyższych częstotliwości. Budując zestaw głośnikowy musimy zadbać o zgodność czasową. Szczególnie w zakresie od 1kHz do 10kHz. To ułatwi nam także ustawienie zgodnej w dużym zakresie częstotliwości – fazy. Zwłaszcza, jeśli dodatkowo zastosujemy głośniki nadające się do strojenia filtrami niskiego rzędu. Zaprocentuje to wierną reprodukcją barwy, wyrównaną dynamiką oraz dobrym oddaniem przestrzeni nagrań. Zwiększy realizm przekazu muzycznego.