Stanko Perko
PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI
Diplomsko delo
Maribor, januar 2011
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | I
Diplomsko delo univerzitetnega študijskega programa
PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI
Študent: Stanko Perko
Študijski program: Medijske komunikacije
Smer: Interaktivna grafična komunikacija
Mentor: doc. dr. David Podgorelec
Somentorica: doc. dr. Suzana Žilič Fišer
Lektorica: Marjetka Jošt
Maribor, januar 2011
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | II
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | III
ZAHVALA
Zahvaljujem se mentorju doc. dr. Davidu
Podgorelcu za strokovno pomoč in vodenje pri
opravljanju diplomskega dela. Prav tako se
zahvaljujem somentorici doc. dr. Suzani Žilič
Fišer.
Zahvaljujem se tudi punci Sani, ki me je pri
pisanju diplomskega dela vztrajno spodbujala.
Posebej se zahvaljujem staršem, ki so mi
omogočili študij.
Ateju v spomin.
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | IV
PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI
Ključne besede: množično komuniciranje, množični mediji, prostorski zvok, zvočni
zapis, računalniška animacija, 5.1. surround
UDK: 659.3:655(043.2)
Povzetek
Prostorski zvok je sredstvo, s katerim lahko obogatimo računalniško animacijo in s tem
izboljšamo njeno sporočilno vrednost. V diplomskem delu spoznamo osnove zvoka,
osnove psihoakustike, lastnosti in namen sistemov za reprodukcijo prostorskega zvoka
ter najznamenitejšega med tovrstnimi sistemi, 5.1 surround. Obravnavamo govor,
glasbo in posebne efekte, ki skupaj tvorijo zvočni zapis, pri čemer nas zanima predvsem,
kako omenjene komponente zvoka postaviti na posamezne kanale in zvočnike, da bo
sprejem za gledalca/poslušalca karseda kakovosten. Raziščemo tudi, kako na splošno
poteka ustvarjanje zvoka skozi glavne faze produkcije računalniške animacije.
Pridobljeno teoretično znanje nato uporabimo pri izdelavi praktičnega primera
prostorskega zvočnega zapisa za računalniško animirano sceno. Primer nato še
analiziramo in ovrednotimo izsledke.
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | V
SURROUND SOUND IN COMPUTER ANIMATION
Key words: mass communication, mass media, surround sound, soundtrack,
computer animation, 5.1 surround
UDK: 659.3:655(043.2)
Abstract
The surround sound enriches computer animation and, consequently, improves its
communication value. In this thesis, we get some foundamental knowledge on sound,
psychoacoustics, properties and purpose of systems for surround sound reproduction
and the most representative of these systems, 5.1 surround. We discuss speech, music
and special effects as the elements of a soundtrack, particularly the ways of panning
each of them to specific channels and speakers so that the viewer/listener experiences
the best reception possible. We also explore sound creation and processing through the
production path of computer animation in general. All the knowledge obtained
represents the basis for our practical soundtrack creation in the surround format for
computer animated scene. We finally analyze the described example and evaluate the
results.
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | VI
VSEBINA
1 UVOD ...................................................................................................................... 1
2 MEDIJI, ANIMACIJA IN ZVOK ........................................................................ 3
2.1 ANIMACIJA KOT OBLIKA MNOŽIČNEGA KOMUNICIRANJA ................................... 3
2.2 RAZVOJ PROSTORSKEGA ZVOKA ........................................................................ 5
3 TEORIJA ZVOKA ............................................................................................... 11
3.1 FIZIKALNE LASTNOSTI ZVOKA ......................................................................... 11
3.2 DIGITALNI AVDIO ............................................................................................ 13
3.3 DOJEMANJE ZVOKA ......................................................................................... 15
4 5.1 SURROUND ................................................................................................... 17
4.1 KANALI IN ZVOČNIKI ....................................................................................... 17
4.2 STANDARDIZIRANA POSTAVITEV ..................................................................... 18
4.3 VARIACIJE POSTAVITEV ................................................................................... 20
4.4 ČASOVNA NASTAVITEV POSAMEZNIH IZHODOV ZA ZVOČNIKE ......................... 21
4.5 LFE – KANAL 0.1 ............................................................................................. 22
5 PSIHOAKUSTIKA .............................................................................................. 24
6 ZVOK ZA ANIMACIJO ..................................................................................... 31
6.1 GOVOR ............................................................................................................ 31
6.2 GLASBA ........................................................................................................... 33
6.2.1 Pomen glasbe v animaciji ........................................................................... 34
6.2.2 Kreiranje glasbe ......................................................................................... 36
6.3 POSEBNI EFEKTI ............................................................................................... 38
6.3.1 Konceptualizacija efektov ........................................................................... 38
6.3.2 Kreiranje posebnih efektov ......................................................................... 40
6.4 OSNOVE OBLIKOVANJA ZVOKA ........................................................................ 42
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | VII
7 PROCES PRODUKCIJE .................................................................................... 47
7.1 PREPRODUKCIJA .............................................................................................. 47
7.2 PRODUKCIJA .................................................................................................... 49
7.2.1 Produkcijski časovni plan za računalniško animacijo ............................... 49
7.2.2 Naloge oblikovalca zvoka v fazi produkcije animacije .............................. 50
7.3 POSTPRODUKCIJA ............................................................................................ 52
7.3.1 Pozicioniranje v večkanalnem zvočnem zapisu .......................................... 53
7.3.2 Operacije v zaključni fazi mešanja zvoka ................................................... 56
8 PRAKTIČEN PRIMER ....................................................................................... 59
8.1 PREPRODUKCIJA .............................................................................................. 60
8.2 PRODUKCIJA .................................................................................................... 61
8.3 POSTPRODUKCIJA ............................................................................................ 62
8.4 ANALIZA ......................................................................................................... 67
9 SKLEP ................................................................................................................... 70
VIRI ............................................................................................................................... 71
PRILOGE ...................................................................................................................... 74
PRILOGA 1: PREGLEDNICE LASTNOSTI FORMATA LPCM ............................................. 74
PRILOGA 2: APLIKACIJA KANALOV NA STEZE V ZVOČNEM ZAPISU 5.1 ......................... 75
PRILOGA 3: ZVOČNI ZAPIS PRAKTIČNEGA PRIMERA (CD) ............................................ 76
Stanko Perko - PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | VIII
SEZNAM SLIK
Slika 1.1: Model množičnega komuniciranja (Splichal, 1999) .......................................... 3
Slika 3.1: Sinusna krivulja .............................................................................................. 11
Slika 3.2: Fazno izničevanje ........................................................................................... 12
Slika 3.3: Shema A/D in D/A pretvorbe (Beauchamp, 2005) ........................................... 14
Slika 3.4: Reverb in echo (Beauchamp, 2005) .................................................................. 16
Slika 4.1: Kinematografski sistem 5.1 (DOLBY, 2005) .................................................. 17
Slika 4.2: Domači sistem 5.1 (DOLBY, 2005) ................................................................. 17
Slika 4.3: Standardizirana postavitev 5.1 (AES, 2010) .................................................... 18
Slika 4.4: Krivulje enake glasnosti (Holman, 2008)......................................................... 23
Slika 5.1: Nizke in visoke frekvence v primerjavi s človeško glavo (Beauchamp, 2005) 24
Slika 7.1: Časovna koda SMPTE ................................................................................... 48
Slika 7.2: Sinhronizacijski signal (Beauchamp, 2005) ..................................................... 50
Slika 7.6: Pozicioniranje govora v sistemu 5.1 (Beauchamp, 2005) ................................ 54
Slika 7.9: Pozicioniranje glasbe v sistemu 5.1 (Beauchamp, 2005) ................................. 54
Slika 7.7: Pozicioniranje posebnih efektov v sistemu 5.1 (Beauchamp, 2005) ................ 55
Slika 7.8: Pozicioniranje ambienta v sistemu 5.1 (Beauchamp, 2005) ............................. 56
Slika 8.1: Avdio lastnosti ............................................................................................... 63
Slika 8.2: Video in avdio steze v postopku mešanja zvoka ............................................ 64
Slika 8.3: Pozicioniranje za prvi posnetek...................................................................... 65
Slika 8.4: Pozicioniranje za drugi posnetek.................................................................... 66
Slika 8.5: Procesiranje signala ........................................................................................ 66
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 1
1 UVOD
Predmet diplomskega dela je izdelava prostorskega zvočnega zapisa za računalniško
animirano sceno. Zvok je element, ki vizualno predstavitev obogati in jo v primeru tehnike,
splošno znane pod imenom surround, razširi v prostorsko dimenzijo, s čimer jo vsaj v
akustičnem smislu osvobodi dvodimenzionalne prikazovalne površine. Zvočni zapis ali
soundtrack bo izdelan za najbolj razširjen sistem za reprodukcijo prostorskega zvoka, 5.1
surround, ki ga bomo tekom raziskave podrobneje spoznali.
Pri svojem delu želimo doseči naslednje cilje:
• opredeliti animacijo kot sredstvo množičnega komuniciranja,
• raziskati razvoj prostorskega zvoka in preučiti njegove lastnosti,
• preučiti vrste zvoka, ki se pojavljajo v animaciji – govor, glasba in posebni efekti,
• ugotoviti, kako izdelava zvočnega zapisa sovpada s fazami produkcijskega procesa
animacije, ter
• pridobljeno znanje aplicirati na konkretnem primeru in analizirati različne vplive na
rezultat.
Teza diplomske naloge je, da se s poznavanjem karakteristik sistema, za katerega ustvarjamo
zvočni zapis, ne glede na uporabljeno programsko opremo, lahko bistveno izboljša prostorski
vtis zaznavanja zvoka v vizualiziranih virtualnih okoljih.
Pri izdelavi diplomske naloge bomo uporabljali deskriptivne in komparativne metode s
študijem domače in predvsem tuje literature ter spletnih virov. Pridobljena teoretična znanja
bomo aplicirali na praktičnem primeru, ko bomo obstoječo računalniško animacijo opremili s
prostorskim zvokom. Izvedli bomo več poskusov, kjer bomo spreminjali predvsem prostorske
relacije med poslušalcem oz. virtualno kamero, 3D modeli navideznega okolja, ki oddajajo
zvok, in zvočniki. V analizi bomo poskusili poiskati smiselne povezave med dobljenimi
praktičnimi rezultati in med izsledki teoretičnih raziskav.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 2
V naslednjem poglavju bomo animacijo opredelili kot medij in raziskali razvoj prostorskega
zvoka, ki je njen nepogrešljiv del. V tretjem poglavju bomo spoznali osnovne lastnosti zvoka,
karakteristike digitalnega avdia ter človeško dojemanje akustičnih dražljajev. To nam bo
služilo kot osnova za nadaljno raziskavo. Sledila bo obravnava prostorskega zvoka, pri čemer
bomo opisali lastnosti 5.1-kanalnega zvoka, kot so korelacija med kanali in zvočniki,
standardizirana postavitev zvočnikov po prostoru, variacije postavitev ter 0.1 kanal, kot
posebnost v prostorskem zvoku. Predmet debate v petem poglavju bo psihoakustika, ki se
ukvarja s fenomenom lokalizacije izvora zvoka v kombinaciji s človekovim slušnim
aparatusom. Te ugotovitve so pomembne za razumevanje nekaterih specifik sistema 5.1 in
ostalih sistemov za reprodukcijo prostorskega zvoka in s tem tudi priprave materialov, ki naj
bi se preko teh sistemov predvajali. V šestem poglavju bomo podrobneje obdelali tri glavne
skupine, v katere delimo zvoke, ki se pojavljajo v animaciji. To so govor, glasba in posebni
efekti. Vsak od teh zvokov je specifičen in po svoje prispeva k celotni zvočni sliki kot podpori
vizualni prezentaciji. Sledila bo obravnava produkcijskega procesa zvoka za animacijo v
konteksu glavnih faz izvedbe projekta. Vse pridobljeno znanje bomo na koncu aplicirali v
izdelavo prostorskega zvoka za animirano sceno, katere rezultat bo zvočni zapis v formatu 5.1
surround. Vizualni izgled modeliranih likov in animacije bomo postavili v drugi plan, saj za
naše poskuse ne potrebujemo lepih, ampak predvsem glasne modele.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 3
2 MEDIJI, ANIMACIJA IN ZVOK
Da lahko govorimo o zvoku v animaciji, moramo najprej razumeti, kako slednja preko
medijev sporoča svojo vsebino in na kakšen način zvok doprinese k temu procesu. Zato bomo
na začetku obdelali teorijo množičnega komuniciranja in tako definirali tudi pojem množični
medij. Potem bomo umestili animacijo v sfero medijev in na koncu preiskali najpomembnejše
zgodovinske točke v razvoju prostorskega zvoka.
2.1 Animacija kot oblika množičnega komuniciranja
Množično komuniciranje je družbeno sporočanje, ki je nastalo s pojavom množične družbe.
»Množično sporočanje je namenjeno razmeroma velikemu, raznovrstnemu in anonimnemu
občinstvu.« (Splichal, 1999, 77) To pomeni, da naslavlja javnost nasploh in ne le določene
osebe.
Teoretiki so za nazoren prikaz sporočanja izdelali številne modele, ki slikovito opisujejo
delovanje procesa. Osredotočili se bomo na najosnovnejšega, ki razlaga, da so za sporočanje
nujni trije elementi: vir, sporočilo in prejemnik. Po tem modelu skuša sporočevalec (vir)
preko ukodiranega sporočila (signal), ki ga mora naslovnik (prejemnik) razkodirati, s slednjim
deliti določeno informacijo. Proces človeškega sporočanja prikazuje slika 1.1.
Slika 1.1: Model množičnega komuniciranja (Splichal, 1999)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 4
Da sporočanje doseže želeni učinek, mora izpolnjevati naslednje štiri pogoje: (Splichal, 1999)
1. Sporočilo mora biti oblikovano in poslano tako, da pritegne pozornost predvidenega
naslovnika.
2. Sporočilo mora uporabljati znake, ki se nanašajo na skupne izkušnje vira in naslovnika, da
bi lahko pomen 'spravilo skozi'.
3. Sporočilo mora zbuditi osebnostne potrebe pri naslovniku in mu ponuditi nekaj načinov
njihove zadovoljitve.
4. Sporočilo mora ponuditi način zadovoljitve potreb, ki ustreza skupinski situaciji, v kateri
je naslovnik v trenutku, ko se je odločil za želeni odgovor.
Sredstvo, preko katerega se vrši množično komuniciranje, je množični medij. Značilnosti
množičnih medijev so univerzalnost v dosegu, velika razširjenost in javni značaj. S tem, ko
dosegajo široko občinstvo, igrajo tudi pomembno vlogo pri procesu socializacije. Funkcije
množičnih medijev so: (Erjavec, 1999)
• informacijska funkcija,
• interpretacijska funkcija,
• socializacijska funkcija in
• zabavna funkcija.
»Medij je v osnovi tehnično ali fizično sredstvo preoblikovanja sporočila v signal, ki ga je
mogoče prenašati po kanalu.« (Fiske, 2005, 32) Kanal je fizično sredstvo, preko katerega je
signal prenesen. Glavni kanali so svetlobni valovi, zvočni valovi, radijski valovi, telefonske
žice in podobno. Tehnološke lastnosti medija so določene z naravo razpoložljivih kanalov.
Fiske (2005) deli medije na tri glavne skupine:
1. Predstavitveni mediji: glas, obraz, telo.
2. Reprezentacijski mediji: knjige, slike, pisanja.
3. Mehanični mediji: telefon, radio, televizija.
Da lahko animacijo opredelimo kot medij, jo moramo najprej definirati. Slovar slovenskega
knjižnega jezika opisuje animacijo kot navidezno oživljanje predmetov s premikanjem
oziroma gibanjem le-teh. Rezultat snemanja animacije v računalniškem okolju je zaporedje
statičnih slik, ki ob ustrezni hitrosti zaporednega predvajanja poustvari iluzijo gibanja.
(Wellins, 2006) Animacija potemtakem predstavlja eno izmed filmskih tehnik, ki mora
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 5
zagotoviti prikaz vsaj šestnajstih slik v sekundi. (Kavčič, Vrdlovec, 1999) Poleg tega, da je
vizualna vsebina ustvarjena in oživljena v virtualnem okolju, pa v nasprotju s klasično
filmsko tehniko sliko zajema s pomočjo navidezne kamere. Računalniška animacija omogoča
poustvarjanje realnosti kakor tudi kreiranje domišljijskega sveta. Zaradi svoje vsestranskosti
je postala nepogrešljiv del filmske industrije. (Wellins, 2006) Zato je že od vsega začetka
kategorizirana kot film, za katerega je znano, da je eden izmed tradicionalnih medijev.
Tako se je zvok, namenjen animaciji, razvijal skupaj s filmskim. Zato imata veliko skupnih
lastnosti. Najvažnejša z vidika sporočanja je podkrepiti in tudi izboljšati sporočilno vrednost
filma ozroma animacije. K temu dodatno prispeva prostorski zvok, katerega bomo
obravnavali v nadaljevanju.
2.2 Razvoj prostorskega zvoka
Holman (2008) ugotavlja, da so že v 16. stoletju začeli prostorsko ločevati zvoke glasbenih
inštrumentov. Giovanni Gabrieli je leta 1585, ko je postal glavni organist v baziliki Sv. Marka
v Benetkah, bil prvi, ki je določil natančne pozicije za glasbenike. Razporedil jih je v križni
vzorec velikosti nekje 5 krat 6 metrov. V tako razvijajočem se polifoničnem stilu je poskrbel,
da se melodični deli skladb razlikujejo, k temu pa je pripomoglo prav prostorsko razporejanje
glasbenikov po skupinah.
V 19. stoletju se je pojavil znan primer, v katerem je bila oboa postavljena izven odra, s
čimer so hoteli ponazoriti oddaljenost (Symphonie Fantastique, 1830). V drugem primeru pa
so skladatelji uporabili štiri manjše pihalne orkestre, postavljene po štirih nebesnih smereh:
sever, jug, vzhod in zahod. S tem so poudarili prostor (Requiem - Tuba mirum, 1837). V
tretjem primeru so pihalni inštrumenti bili nameščeni na balkonu, v partiturah pa so bili
poimenovani, kot 'oddaljeni' (Resurrection, 1895). Ideja prostorskega zvočnega sistema (angl.
surround sound system) je tako stara vsaj pol tisočletja in je skladateljem že dolgo na voljo pri
njihovem ustvarjanju.
Leta 1933 so inženirji iz Bell Labs v Washingtonu predstavili 3-kanalni stereofonski sistem,
ki je osnova za nekatere sodobne večkanalne sisteme. Prišli so do zaključka, da bi bilo
potrebno neskončno število sprednjih zvočnikov, vendar je praktična rešitev, uporaba levega,
centralnega in desnega zvočnika, primerna za ponazoritev neskončnega števila. Sistem ni
vključeval nobenega zvočnika za hrbtom poslušalca, vendar je potrebno upoštevati dejstvo, da
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 6
se je predvajanje dogajalo v velikem prostoru s svojim odmevom, kar je na nek način
poustvarjalo vključenost v zvočno polje. Tega leta so izvedli zanimivo demonstracijo, pri
kateri je bil signal za predvajanje v Washingtonu v živo poslan preko visokopasovnih
telefonskih linij iz oddaljenega mesta v ZDA. Pri tem so bili zvočniki skriti za zaveso,
prepustno za zvok, s 3-kanalnim sistemom pa je upravljal Leopold Stokowski, ki je bil takrat
glasbeni direktor filadelfijskega orkestra. Tako je pevec pel na odru v Filadelfiji, na odru v
Washingtonu pa se je predvajal stereo prenos, ki je pričaral občutek, kot bi bil pevec dejansko
na odru. Nekaj trenutkov za tem so dodali še trobente in na koncu celotni orkester. Nato so
odgrnili zaveso in občinstvo je bilo presenečeno, saj so navzoči ugotovili, da so poslušali le
zvok iz zvočnikov. V tem času je Alan Blumlein v Angliji prav tako razvil 2-kanalno
stereofonsko tehniko. (http://www.stokowski.org)
Za nastanek prostorskega zvočnega sistema, ki ga bomo v nadaljevanju imenovali sistem
surround, je odgovoren Walt Disney, ki je prišel na idejo, da naj let čebele v animiranem
filmu ne bo omejen le na območje filmskega platna, kot mu je to predlagal Stokowski, ampak
mora biti zaznaven po celotnem avditoriju. Do te ideje je prišel leta 1938, ko sta skupaj s
Stokowskim ustvarjala animirani film Fantasia, vendar v tem filmu, ki je izšel leta 1940,
čebela nikoli ni poletela med občinstvom. Disneyevi inženirji so takrat uporabili tri sprednje
zvočnike in dva t.i. surround zvočnika, postavljena v zadnjih kotih dvorane. (Holman, 2008)
Angleška beseda surround, ki v prevodu pomeni »obkrožati, obdajati, obkoliti«, torej v tem
kontekstu pomeni sistem, v katerem je poslušalec z vseh strani, tudi od zadaj, obkrožen z
zvočniki.
Disneyevi inženirji so tistega leta (1940) razvili tudi večstezno snemanje, točkovno (angl. pan
pot) snemanje, presnemavanje ter polja surround zvočnikov, namenjena za kinematografe.
Tako je nastal Fantasound – predhodnik današnjih sistemov surround.
(http://en.wikipedia.org/wiki/Fantasound)
Leta 1952 je Hazard Reeves razvil 7-kanalni zvok, ki je skupaj s filmom, namenjenim za
široko upognjeno platno in dejansko posnetim na treh vzporednih filmih, tvoril tako imenovan
sistem Cinerama. Le-ta je uporabljal pet sprednjih kanalov in dva namenjena za surround.
Operater je med samo predstavo lahko usmerjal oba kanala surround na zvočnike, namenjene
za surround, ali pa na sprednje stranske in surround zvočnike hkrati. Cinerama se zaradi
neekonomičnosti ni nikoli prav uveljavila. (http://en.wikipedia.org/wiki/Cinerama)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 7
Leta 1953 je 20th Century Fox predstavil sistem CinemaScope. Uporabljal je cenejši 35 mm
film s štirimi kanali zvoka, posnetimi na robovih samega traku. Trije kanali so bili namenjeni
za sprednje zvočnike, četrti pa je bil dodeljen zvočnikom v avditoriju. Med tihimi prehodi se
je predvsem iz zvočnikov v avditoriju, ki so bili namenjeni predvsem za efekte, slišalo preveč
šuma, zato so na četrti kanal poleg samega materiala posneli še visokofrekvenčni sinusni
signal na 12 kHz, ki je služil za vklop in izklop samega kanala. Tako so se izognili
predvajanju šuma, ko na posnetku ni bilo pomembnih zvokov.
(http://en.wikipedia.org/wiki/CinemaScope)
Leta 1955 sta oče in sin, Michael Todd in Michael Todd ml., razvila 70 mm filmski format s
šestimi kanali za zvok, poimenovan Todd AO. Pri tem sta bila na vsaki strani po dva kanala
posneta zunaj perforacij in eden znotraj le-teh. Pet kanalov je bilo razporejenih na sprednje
zvočnike, šesti pa je služil za surround. Tudi slika za projekcijo na široko platno je bila
izboljšana, saj je namesto treh trakov kot pri Cinerami in namesto stiskanja slike, kot pri
CinemaScopu, bil uporabljen širši filmski trak, ki je zagotavljal visoko kakovost.
(http://en.wikipedia.org/wiki/Todd_AO)
Od 50-ih do 70-ih let dvajsetega stoletja je zaradi visokih stroškov večkanalnega snemanja
kraljeval kot poenostavitev kinematografske prakse za domačo uporabo 2-kanalni stereo.
Gramofonska plošča ima samo dve steni ob zarezi, zato lahko nosi le dva signala. 2-kanalnem
stereu za domačo reprodukcijo, za katerega začetek lahko štejemo gramofonsko ploščo z
dolgim časom predvajanja Long Play (1958), v nadaljevanju LP, so sledili še drugi formati, ki
so se opirali na predvajanje preko dveh zvočnikov. To so bile razne kasete z magnetnim
trakom, FM radio in konec koncev tudi glasbena zgoščenka – Compact Disc (1982), v
nadaljevanju CD. 2-kanalni stereo se za reprodukcijo centra sprednjega zvočnega polja
poslužuje navidezne slike (angl. phantom image). (Holman, 2008) Na osnovi tega principa
deluje pravilno nastavljen stereo precej magično, saj zvočna slika praktično lebdi med dvema
zvočnikoma. Na žalost pa je ta efekt zelo krhek, saj je v veliki meri odvisen od položaja
poslušalca, ki mora sedeti točno na sredini levo in desno simetričnega prostora. Vsekakor je
dober za enega poslušalca, zato je dolga leta prevladoval avdiofilsko sfero. Iz naštetih
razlogov pa ni primeren za večje število poslušalcev.
Obdobje poznih 60-ih in 70-ih let prejšnjega stoletja je med drugim poimenovano tudi kot
Quad era. Osnovna ideja kvadrofonske tehnike je bila uporaba štirih kanalov vkodiranih v dva
signala na gramofonski plošči, ki bi krmilili štiri zvočnike, postavljene v kvadratu okoli
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 8
poslušalca in usmerjene proti točki poslušanja. S tem bi dosegli enakomerno zvočno polje
okrog poslušalca, ki bi na ta način bil navidezno pozicioniran v središče glasbenega odra.
Vendar ima človeški sluh različni frekvenčni odziv za različne kote, od koder prihaja zvok.
To pogojujeta dve ušesi z obliko zunanjega ušesa in dejstvo, da se nahajata vsako na svoji
strani glave, ki predstavlja oviro za zvok. S tem se zadeva preveč zakomplicira, da bi tak
sistem lahko uspel. Dodatno pa se zaplete še s finančnega stališča, saj pri tej tehnologiji
potrebujemo poseben dekoder in dva ojačevalnika namesto enega, kar zadevo precej podraži.
V 70-ih letih dvajsetega stoletja se je pojavil tudi Dubbed Dolby Stereo, ki je bil zapisan na
optičnem traku, kar je zelo izboljšalo kakovost napram magnetnim trakovom. Na samem
mediju sta bila posneta dva kanala, ki sta se s pomočjo posebne amplitudno-fazne matrike ob
predvajanju dekodirala v 4-kanalni zvok. Sistem so nadgradili še s sistemom Dolby A noise
reduction, ki je bil namenjen razširitvi pasovne širine, medtem ko je zadržal nivo šuma
razumno nizko. Tako se je uveljavil 35 mm optični filmski format. Vendar so ustvarjalci
filmov Star Wars (1977) in Close Encounters of the Third Kind (1977) ponovno oživili idejo
70 mm formata Todd AO s šestimi kanali za zvok, ker so potrebovali zadostno kapaciteto za
sprednje tri kanale, surround in takrat novo nastali nizkofrekvenčni kanal Baby Boom. Kmalu
za tem se je pojavil film Superman (1978), v katerem sta bila prvič uporabljena ločena kanala
za levi in desni surround za krmiljenje leve in desne polovice polja zvočnikov surround.
Zanimivo je, da je bil kanal Baby Boom posnet skupaj z levim in desnim kanalom surround,
od katerih se je ob predvajanju ločil s pomočjo filtrov. Vseeno pa je format ostal kompatibilen
s kinematografi, ki so imeli na voljo le mono surround, saj je za to zadoščal že en sam kanal,
drugega pa so preprosto ignorirali. Ustvarjalci filma Apocalypse Now (1979) so se potrudili
in zelo umetniško uporabili stereo surround. Odtlej je večina izdaj na 70 mm filmu
uporabljala tri sprednje, dva surround in en nizkotonski kanal Baby Boom. (Holman, 2008)
Kot naslednik Dolby A noise reduction se je leta 1986 pojavil izboljšan sistem Dolby SR, ki
je frekvenčni spekter razširil do 16 kHz.
Leta 1987 je podkomite združenja Society of Motion Picture and Television Engineers, v
nadaljevanju SMPTE, iskal rešitev za uporabo digitalnega zvoka na filmu. Po številnih
srečanjih in pripravljeni dokumentaciji je sprejel, da je 5.1-kanalni sistem minimalno, kar
lahko zadosti lastnostim pričakovanim od novega sistema. (http://www.smpte.org)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 9
Za domačo uporabo so se začele uporabljati video kasete Video Home System (1976), v
nadaljevanju VHS, in nekaj kasneje Laser Disc (1987) ali laserski video disk, v nadaljevanju
LD, ki sta lahko nosila kodirani 4-kanalni zvočni zapis Dolby Stereo. Pri obeh nosilcih pa je s
časom prišlo do izboljšanja avdio zapisa. VHS je dobil tako imenovan Hi-Fi, LD pa je bil prvi
medij, ki je v domače okolje lahko prinesel digitalni zvok za spremljavo slike. Nosil je dva
44,1 kHz LPCM signala s 16 biti. Število filmov, dosegljivih na teh medijih, je hitro zraslo,
prav tako pa tudi število dekoderjev Dolby Pro Logic za domačo uporabo. Dekoderji delujejo
na osnovi matrike, ki lahko iz dveh signalov na mediju zagotovi poleg levega in desnega
kanala tudi center in kanal surround. To je veliko potrošnikov tudi s pridom izkoristilo.
Čeprav ima svoje pomanjkljivosti, je matrika vseeno dobro in dolgo služila, filmska industrija
pa je bila mnenja, da bi bil diskretni večkanalni sistem veliko boljši.
Pod okriljem SMPTE so se pojavili sledeči formati za zvok ob spremljavi slike:
1992 – Dolby Digital,
1993 – DTS (Digital Theater Systems) in
1993 – SDDS (Sony Dynamic Digital Sound).
V le-teh so bili razviti sistemi kodiranja zvoka, ki delujejo na zakonih psihoakustike. Najbolj
znan med njimi je AC-3. Le-ta omogoča shranjevanje večkanalnega zvoka, ki pa na nosilcih
ne zavzame nič več prostora, kot poprej nekodirani stereo. (http://en.wikipedia.org/wiki/Ac3)
Leta 1996 se je pojavil Digital Versatile Disc – Video, v nadaljevanju DVD-V, ki je požel
velik uspeh ravno v času, ko je CD-ju začela prodaja drastično upadati. Zato sta se kmalu
pojavila še Digital Versatile Disc – Audio, v nadaljevanju DVD-A (2001) in Super Audio
Compact Disc (2003), v nadaljevanju SACD, oba namenjena za visokokakovostni avdio. Prvi
shranjuje 5.1-kanalni in drugi 2-kanalni zvok. Vendar nista bila zmožna spreobrniti toka
distribucije glasbe v prid fizičnim medijem, saj je z razcvetom računalniške tehnologije začelo
prevladovati prenašanje datotek s svetovnega spleta.
V naraščajoči želji po vedno večjem številu kanalov, ki so osnova za izkušnjo zvoka,
izhajajočega iz več smeri, se je leta 1999 z izdajo prvega filma nove serije Star Wars pojavil
sistem Dolby Surround EX. Le-ta uporablja novo verzijo matrike Dolby Surround, ki sedaj
zagotavlja ločevanje kanalov surround na levega, zadnjega in desnega. Ker pa je uporabljena
matrika 4:2:4, kar pomeni, da lahko nosi skupno 8 kanalov vkodiranih v 4 signale, medtem ko
je bilo dejansko uporabljen en manj, je bil slednji v filmu We Were Soldiers (2002)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 10
uporabljen še za zvok od zgoraj. Prav tako je DTS razvil diskretni 6.1-kanalni sistem DTS ES.
(Holman, 2008)
Leta 2006 sta izšla High Definition DVD, v nadaljevanju HD-DVD, in Blu-ray Disc, v
nadaljevanju BD, ki sta zelo povečala kapaciteto shranjevanja podatkov na disk velikosti le 12
cm. Prvi omogoča 15 GB podatkov v enoslojni oz. 30 GB v dvoslojni izvedbi, celotna
količina pa se z uporabo obeh strani plošče še podvoji. Drugi pa zmore shraniti 25 GB v
enoslojni in 50 GB v dvoslojni izvedbi. S tem je dosežen velik skok v kakovosti tako video
kot avdio vsebin, shranjenih na modernih medijih.
Od leta 2006 je v razcvetu Digital Cinema ali digitalni kino. To pomeni, da je celotni
postopek od ustvarjanja pa do predvajanja filma digitaliziran. Pri tem je možno doseči do 16
kanalov avdio signala LPCM s frekvenco vzorčenja 48 kHz in 24-bitno globino (24 bitov na
zvočni vzorec). (http://en.wikipedia.org/wiki/Digital_cinema)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 11
3 TEORIJA ZVOKA
3.1 Fizikalne lastnosti zvoka
V fizičnem svetu je prisotnost zvoka pogojena s tremi zahtevami. (Beauchamp, 2005) Prva je
izvor zvoka, ki ustvari akustično energijo. Druga je medij, preko katerega se ta energija
prenaša. Tretja pa je sprejemnik, ki energijo sprejme. Šele ko se ta energija preko živčnih
impulzov, ki jih uho generira ob sprejemu akustične energije, prenese v možgane, le-ti
obdelajo posredovane impulze, katerih subjektivna interpretacija se imenuje zvok.
Sinusna krivulja, ki jo prikazuje slika 3.1, je najosnovnejša oblika zvočnega valovanja.
Horizontalna linija predstavlja nično točko, kjer zvočna energija ne obstaja. Prostor nad njo
predstavlja pozitivni pritisk – kompresijo, ki se z višanjem krivulje povečuje. Najvišja točka
krivulje predstavlja vrh. Prostor pod horizontalno linijo predstavlja negativni pritisk –
ekspanzijo. S spuščanjem krivulje se ustvarja vakuum. Najnižja točka krivulje predstavlja
dolino. Cikel pomeni en cel dvig nad in spust pod horizontalno linijo.
Slika 3.1: Sinusna krivulja
Faza pomeni zamik krivulje po horizontalni – časovni liniji. Če dve identični krivulji
združimo v fazi, se njuna signala seštejeta. V primeru združitve dveh krivulj izven faze se
njuna signala, sorazmerno s faznim zamikom, izničita. (Sinclair, 1998) Temu pojavu pravimo
fazno izničevanje (angl. phase cancellation) in je predstavljen na sliki 3.2.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 12
Slika 3.2: Fazno izničevanje
Frekvenca je določena s številom ciklov na sekundo. En cikel na sekundo je enako 1 Hz –
Hertz. Višina tona je subjektivna interpretacija frekvence. Človeško uho zazna frekvenčni
spekter od 20 Hz do 20 kHz. Frekvenčni odziv je zmožnost proizvajanja ali sprejemanja
signala znotraj nekega frekvenčnega spektra. Mnogi komercialni sistemi imajo zmožnost
predvajanja ožjega frekvenčnega spektra, kot ga lahko zazna človeško uho. Frekvenca ima
tudi psihološke vplive. Nizki toni predstavljajo vertikalno percepcijo, visoki pa horizontalno.
Tako se nizki toni ponavadi pozicionirajo naprej-nazaj, visoki pa levo-desno. Z višanjem
jakosti nizkih tonov lahko lepo ponazorimo padanje kakšnega predmeta.
Amplituda pomeni količino energije, prisotne v zvočnem valovanju – signalu. Večja
amplituda pomeni večjo izhodno moč in s tem višji akustični pritisk ob predvajanju signala.
(Sinclair, 1998) Človeška subjektivna interpretacija ob povišanju tega pritiska je povišanje
glasnosti. Le-ta se ob povišanju za 6-10 dB za večino poslušalcev interpretira kot podvojena.
Govor je za poslušalca najpomembnejša referenca za ocenjevanje glasnosti posnetka. Razlike
v amplitudi govora, posebnih efektov in glasbe vplivajo na jakost, poudarek, zaznano velikost
in približno lokacijo zvočnega objekta. Percepcija glasnosti je prav tako frekvenčno odvisna.
Človeška zaznava je najmočnejša v srednjem območju. Večja amplituda je potrebna za nizke
tone, da se ujemajo s srednjimi.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 13
Barva zvoka (angl. timbre) označuje posebnost vsakega zvoka, zaradi katere po glasu
prepoznamo sorodnike in med seboj ločimo glasbene inštrumente. Vsaka unikatna zvočna
oblika je produkt osnovnega valovanja, pripadajočih višjih tonov, fizičnih karakteristik zvoka
in volumenske ovojnice. Njena osnova sta najnižja frekvenca in najvišja amplituda. Vse
frekvence, ki so višje od osnove, se v kombinaciji z njo združijo in tvorijo zvočno obliko, ki
je edinstvena kot prstni odtis.
Valovna dolžina je horizontalna mera zaključenega zvočnega vala. Je obratno sorazmerna s
frekvenco. (Sinclair, 1998) Razdalja med ušesi povprečnega odraslega človeka je nekje 18
cm. Valovi različnih dolžin se različno odzivajo na fiksno razdaljo med ušesi.
Nizkofrekvenčni valovi so daljši in se tako ovijejo okrog glave ter s tem zmanjšujejo
zmožnost zaznave smeri in odkrivanja lokacije izvora zvočnega valovanja. Ko pa se valovna
dolžina približuje razdalji med ušesi, kar ustreza frekvenci približno 2 kHz, postaja zaznava in
lokalizacija izvora vedno natančnejša (pogl. 5). Uporaba nizkih tonov je trik za povečanje
faktorja strahu. Pri tem pripada k strašljivemu prizoru še zvok, kateri predstavlja neznano
pozicijo izvora in s tem poudarja brezizhodno situacijo. (Beauchamp, 2005)
3.2 Digitalni avdio
Digitalni avdio omogoča enostavno opravljanje postopkov, kot so snemanje, urejanje,
sinhronizacija in shranjevanja zvoka. Iz teh razlogov dandanes večina ustvarjalcev izbere
digitalni avdio namesto analognega. Še ena pomembna prednost je v možnosti neskončnega
kopiranja zvočnega materiala brez slehernega vpliva na kakovost zvoka. To pa dobro vpliva
na razvoj zvoka za animacijo, kjer je večkratno kopiranje nuja. Vendar digitalni avdio ni
povsem brez napak, zato je pomembno, da dobro poznamo njegove osnovne karakteristike in
potencial, ki ga nudi pri ustvarjanju.
Zajemanje avdio signala
Proces zajemanja akustične energije in spreminjanje njenih vrednosti v digitalno obliko je
znan tudi pod pojmom digitalizacija. Le-to omogočajo računalniški čipi, poznani kot
analogno-digitalni (A/D) pretvorniki. Ko je zvok digitaliziran, je avdio signal možno uvoziti
in z njim manupulirati v posebnem računalniškem okolju. Predvajanje tega signala je možno s
pomočjo digitalno-analogne (D/A) pretvorbe. Slika 3.3 prikazuje zajemanje in predvajanje
avdio signala.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 14
Slika 3.3: Shema A/D in D/A pretvorbe (Beauchamp, 2005)
Po Niquistovem teoremu zajemamo zvok z vsaj 2-krat višjo frekvenco od najvišje slišne
frekvence. Omenili smo že, da se človeška percepcija zvoka razteza od 20 Hz do 20 kHz, zato
je bila sprejeta specifikacija za avdio CD 44,1 kHz, za DVD pa se hitrost vzorčenja giblje
med 48 in 96 kHz. Priporočene hitrosti vzorčenja za uporabo na različnih nosilcih so podane v
prilogi 1a. Poglavitni razlog višanja hitrosti vzorčenja visoko nad človeško slišno območje je
v tem, da frekvence, ki se nahajajo v tem območju, pozitivno vplivajo na valovanje in s tem
na rezultirajoči zvok. Prav tako višje hitrosti vzorčenja zagotavljajo prijaznejši in prostornejši
zvok, kakršnega smo na primer vajeni iz analognih sistemov.
Amplituda zvočnega valovanja je digitalno zajeta z vzorčenjem energije vala na več točkah
skozi časovni interval, katerim se pripišejo digitalne vrednosti. Bitna globina pomeni število
bitov za predstavitev posameznega bitnega vzorca oz. digitalne vrednosti. Z dano bitno
globino b lahko predstavimo 2b različnih digitalnih vrednosti, čemur pravimo resolucija. Pri
bitni globini 2 na primer je energija vala zajeta v štirih enakih stopnicah. Vsi deli vala med
stopnicami so zaokroženi navzgor ali navzdol, glede na najbližjo vrednost. Ta postopek se
imenuje kvantizacija in jo seveda zaznamo kot popačenje zvoka. Z večanjem bitne globine se
resolucija izboljšuje, rezultirajoč signal D/A pretvorbe pa izgleda bolj podoben originalnemu
pred vzorčenjem. V teoriji vsak bit pomeni zvečanje celotnega vzorčenega razpona, ki ga
imenujemo tudi dinamični razpon, za 6 dB (Beauchamp, 2005). Standard za CD je 16 bitov,
kar pomeni dinamični razpon 96 dB. V standardu DVD je bitna globina 20 ali 24 bitov.
Priporočene bitne globine za uporabo na različnih nosilcih so podane v prilogi 1b. Dinamični
razpon in razmerje signal/šum v odvisnosti od bitne globine sta podana v prilogi 1c.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 15
Avdio formati
LPCM (linearna pulzno kodna modulacija) je najpogosteje uporabljen format za digitalni
avdio. Pri tem je amplituda predstavljena z zaporedjem kodiranih vrednosti signala, ki
naraščajo v enakomernih intervalih, kar predstavlja valovno obliko (angl. waveform) avdio
signala. LPCM ni stisnjen in podpira številne bitne globine in frekvence vzorčenja. Glasbena
industrija je posvojila format LPCM s 16 bitno resolucijo in 44,1 kHz frekvenčnim območjem
kot tako imenovan standard Red Book za glasbo, shranjeno na CD. Po trenutnih standardih je
to minimum za profesionalni digitalni avdio. Velikosti zvočnih datotek so odvisne od bitne
globine, frekvence vzorčenja, števila kanalov in seveda trajanja samega posnetka.
Najpogosteje uporabljena kodeka za stiskanje 5.1-kanalnega zvoka sta Dolby Digital AC-3 in
Digital Theatrical Systems DTS. Oba koristita omejitve človeškega sluha, kot so frekvenčno
maskiranje in pravilo enake glasnosti za namen zmanjšanja količine podatkov. To pomeni, da
analizirata avdio signal in kodirata le podatke, za katere se domneva, da jih človek lahko
zazna. Kodek AC-3 lahko reducira količino podatkov do 12:1 ob tem, ko kakovost zvoka
ostane skoraj nespremenjena. Je standard za kinematografe in video za domačo uporabo, pred
kratkim je postal tudi standard za HD TV. DTS lahko doseže redukcijo do 4:1. (Beauchamp,
2005)
3.3 Dojemanje zvoka
Kot smo že zapisali v začetku poglavja, akustična energija, ki doseže naš slušni sistem, le-tega
vzdraži, kar povzroči fiziološki proces, ki ga možgani interpretirajo kot zvok. To predstavlja
pojem slišati. Če na zvok nismo pozorni, ne sprejmemo informacij, ki jih le-ta nosi. Kritično
poslušanje pomeni, da se zavestno trudimo izluščiti informacije, ki jih nosi zvok. »Zavedati se
moramo, da kot poslušalci ne posvetimo enake pozornosti vsem dražljajem, katerim smo
izpostavljeni v okolju, kjer se trenutno nahajamo. Odvisno od našega razpoloženja,
pričakovanj in različnih psiholoških in čustvenih faktorjev ignoriramo večino akustične
energije, ki doseže naša ušesa, in slišimo le to, kar se nam v danem trenutku zdi pomembno.«
(Forlenza, Stone, 1993, 3) Večina ljudi posveti zvoku le delček pozornosti, zato mora dobro
izveden zvočni zapis poslušalca motivirati, da pridobi njegovo pozornost in s tem sprejme
informacijo, ki podpira narativnost.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 16
Ko akustična energija iz svojega izvora potuje po prostoru, ustvarja tri tipe zvoka: direktni
zvok, zgodnje odmeve in pozne odmeve. Te tri komponente skupaj definirajo prostor, v
katerem zvočni objekti obstojajo in delujejo med sabo. (Beauchamp, 2005) Reverb in echo sta
besedi, ki se pogosto, čeprav je to narobe, zamenjujeta. Opisujeta zgodnje in pozne odmeve,
kot nazorno prikazuje slika 3.4. Ko sta v zvoku prisotna reverb in echo, dobimo občutek, da je
prostor velik, odprt in sestavljen iz odbojnih površin. S pomočjo frekvence lahko še
podrobneje definiramo prostor, saj se v realnem okolju visoke frekvence hitreje absorbirajo
pri potovanju skozi prostor in morebitne ovire. Zato velja – večji je prostor, več visokih
frekvenc se izgubi.
Slika 3.4: Reverb in echo (Beauchamp, 2005)
Ritem je zaznavni vzorec zvoka in tišine. Hitrost ponavljanja tega vzorca pa je tempo, ki je
lahko konstanten, se pospešuje ali pa pojenja. Oba elementa močno vplivata na gledalčevo
dojemanje hitrosti dogajanja na zaslonu. Ocenimo lahko recimo hitrost korakov, srčni utrip,
premike sekundnega kazalca na uri in še marsikaj.
Na šum lahko gledamo z dveh vidikov, estetskega in fižičnega. Estetski vidik vključuje vse
neželene zvoke. S tega vidika je šum ponekod dodan tudi za povečanje realizma. Iz fizičnega
vidika šum pomeni zvok brez osnovne frekvence, ki bi jo lahko slišali, vendar vključuje
številne frekvence s približno enako glasnostjo, zato nastopi nered. Do neke mere lahko s
programsko opremo šum odstranimo, vendar bo vedno prisoten. Paziti je treba, da je jakost
šuma takšna, da ne vpliva na poslabšanje kakovosti zvoka. Razlika med želenim zvokom in
šumom se imenuje Signal to Noise Ratio, v nadaljevanju SNR. (Sinclair, 1998)
Tišina je pomemben del avdio vizualne predstave. Z njo lahko dosežemo kontrast, pritegnemo
pozornost, vnesemo olajšanje od predhodne napetosti ali vzpostavimo nov položaj izvora
zvoka. Mnogokrat se tišina uporablja tudi tik pred glasnim dogodkom, saj zagotovi potrebno
razliko v glasnosti tako, da le-te ni potrebno navijati v ekstreme. Tišina tudi avtomatsko
pritegne gledalce. Po drugi strani pa jih lahko celo zbega, zato jo moramo uporabljati z veliko
mero previdnosti.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 17
4 5.1 SURROUND
4.1 Kanali in zvočniki
Pomembno je, da ločimo med številom kanalov in številom zvočnikov. Kanal predstavlja
diskretni izhod za enega ali več zvočnikov. Slika 4.1 prikazuje kinematografski 5.1-kanalni
sistem. Razvidno je, da levi in desni kanal surround pokrivata vsak po več zvočnikov, ki
reproducirajo isti signal. Ti dodatni zvočniki omogočajo razporejenost zvoka tudi pri zadnjih
sedežih v dvorani. V primeru 5.1-kanalnega sistema za domačo uporabo, kot ga prikazuje
slika 4.2, levi in desni kanal surround pokrivata vsak po en zvočnik. V obeh primerih pa levi,
center in desni kanal krmilijo vsak po en zvočnik. Skupaj predstavljajo pet diskretnih avdio
kanalov. V sistemu 5.1 surround je uporabljen tudi 'šesti' kanal (oznaka 0.1 v 5.1), imenovan
tudi LFE, za katerega reprodukcijo skrbi poseben nizkotonski zvočnik ali subwoofer.
Slika 4.1: Kinematografski sistem 5.1 (DOLBY, 2005)
Slika 4.2: Domači sistem 5.1 (DOLBY, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 18
4.2 Standardizirana postavitev
Standardizirana postavitev za 5.1-kanalni zvok, kot jo prikazuje slika 4.3, je dokumentirana s
strani AES (Audio Engineering Society) v dokumentu TD1001 ter s strani ITU (International
Telecommunications Union) v predpisu 775. V tej postavitvi se vsi zvočniki nahajajo v
horizontalni ravnini na višini ušes. Iz razloga, da se zagotovi nemotena pot zvoka od zvočnika
do poslušalca, jih je dovoljeno nekoliko dvigniti.
Slika 4.3: Standardizirana postavitev 5.1 (AES, 2010)
Center se nahaja točno v sredini na 0°.
Levi in desni sprednji zvočnik se nahajata na vsaki strani 30° od centra. Tako sta 60°
narazen, kar tvori enakostranični trikotnik s poslušalcem. (AES, 2010) Ta postavitev ima
dolgo zgodovino v 2-kanalnem stereu in je iz istih razlogov uporabljena tudi v 5.1-kanalnem
sistemu. »Širše polje je za stereo dojemanje boljše, vendar preširoko polje lahko ustvari
teževe z zvočnimi slikami, ki ležijo nekje vmes. Kljub temu, da center reši več problemov, ki
jih ima 2-kanalni stereo, vključno z zapolnjevanjem tako imanovane vrzeli med levim in
desnim zvočnikom, je bilo z eksperimenti odkrito, da je 60° kot, ki se uporablja pri 2-
kanalnem sistemu, najboljši tudi za 5.1-kanalni zvok.« (Holman, 2008, 36)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 19
Zvok za film se zanaša na postavitev zvočnikov znotraj meja platna (slika 4.1), s čimer
poustvarja sprednjo stereo sliko, ki se vizualizira na samem platnu. Vendar pa se ob prenosu
filma v video (slika 4.2) levi in desni zvočnik naenkrat pojavita izven slike. »Profesionalci
zaznajo neskladnost slike in zvoka po horizontalni ravnini, ko le-ta doseže 4°, nadalje se okoli
50 % gledalcev zmede, ko kot doseže 15°.« (Holman, 2008, 42) Zato je potrebno v primerih,
ko je slika mnogo ožja od kota 60°, izbrati kompromis med tem, kaj je najbolje za zvok
(±30°) in kaj je najbolje za zvok, ki spremlja sliko (ne veliko čez 4° od zunanje meje slike). V
tem primeru zvočnike namestimo tik ob zunanjem robu ekrana, če uporabljamo ekran, ali
ravno še znotraj meja, če je v igri platno v kombinaciji s projektorjem. To sicer predstavlja
velik kompromis glede zvoka, vendar je nujno, kjer morata slika in zvok delovati usklajeno.
Zvočnika surround se nahajata 110° ±10° od centra, torej 100° do 120° v vsako stran. (AES,
2010) Ta kot je bil določen na podlagi poizkusov. Širše postavljeni zvočniki surround, kar
pomeni, da so le-ti pomaknjeni bolj nazaj, so ob poizkusih proizvedli boljše zvočne slike z
zadnje strani na račun slabše obkroženosti. Nasprotno pa so bolj naprej postavljeni zvočniki
zagotavljali boljšo obkroženost, a se je zadnja zvočna slika zato poslabšala. Prav tako pa je
kot 110° običajno bližje postavitvi v primeru hišnega kina, kjer je položaj gledalca-poslušalca
bližje zadnji steni kot sredini prostora, kjer bi se moral nahajati v primeru širše postavitve.
Višina zvočnikov surround je v mnogih primerih večja glede na sprednje zvočnike. To se
zgodi iz več razlogov, naprimer zato, da se izognemo raznim preprekam v studiu, da se
prilagodimo sedežem v kinodvorani ali domačem kinu. To je v večini primerov tudi dopustno.
Za nekatere tipe vsebin, naprimer glasbo, pa je to lahko usodno, ker dvignjeni zvočniki
surround lahko povzročijo porušitev zvočnega polja. (Holman, 2008)
Basovski zvočnik ali subwoofer se načeloma nahaja v kotu. To ustvari največ moči za nizke
frekvence, ker tla in dve steni služijo kot odbojniki. S premikanjem zvočnika po prostoru
lahko ugotovimo, kako postavitev vpliva na spremembo zvoka zaradi mirujočih valov ter
kako vpliva na vsakega od ostalih kanalov. Na tak način lahko ublažimo odziv. Z več
basovskimi zvočniki, razporejenimi po prostoru, lahko še dodatno izboljšamo zvočno sliko.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 20
4.3 Variacije postavitev
Polja surround
V filmski industriji je uporaba polj surround nekaj povsem vsakdanjega. AES in ITU
priznavata možne prednosti uporabe več kot le dveh zvočnikov surround, saj to omogoča širše
slišno polje in boljšo obkroženost. Obstaja pa pravilo glede uporabe več zvočnikov, ki pravi,
da naj bodo razporejeni enakomerno in simetrično ob levi in desni strani v polju 60° do 150°.
(AES, 2010) Ker se, kot že rečeno, uporabljajo v kinematografih, jih pogosto najdemo tudi v
studiih za filmsko in TV produkcijo. Njihove prednosti in slabosti so naslednje: (Holman,
2008)
• V velikih prostorih lahko polje zvočnikov pokriva občinstvo bolj enakomerno v smislu
samih jakosti zvoka in frekvenčne pokritosti kakor le dva zadaj nameščena diskretna
zvočnika. Ta princip se pogosto prenese tudi v manjše prostore.
• Dodatno je možno nastaviti jakost izhoda posameznih zvočnikov tako, da se jakost zvoka
enakomerno znižuje proti zadnjemu delu prostora. To je pomembno predvsem zato, da
glasnost posameznega zvočnika v polju na vseh točkah po dolžini prostora, gledano od
spredaj nazaj, sovpada z glasnostjo sprednjih zvočnikov, ki se z razdaljo zmanjšuje.
• V kontekstu slike s spremljajočim zvokom je težje določiti položaj polja zvočnikov kot en
sam zvočnik, saj zvok prihaja iz več virov, razporejenih ob straneh. To zmanjšuje tako
imenovan učinek izhoda, kar pomeni, da zvok iz zvočnikov surround ne pritegne naše
pozornosti tako močno, da bi pogledali vstran od slike, kjer najbolj izstopa znak za izhod.
• Pomanjkljivost je ta, da iz različnih zvočnikov zaradi različnih razdalj od ušesa zvok ne
prihaja hkrati. Rezultat je nekoliko spremenjen zvok, ki je posledica kombinacije
identičnih zvočnih valovanj z različnimi časovnimi zakasnitvami. Ta efekt se sliši
podobno kot govorjenje v sodu, vendar le na kanalih surround. To najbolj izstopa pri
dinamičnem pozicioniranju zvoka, naprimer od spredaj na surround. Pri tem je
sprememba v zvoku prav tako dinamična. Izkazalo se je, da je nemogoče najti
izenačevalni postopek, s katerim bi lahko ta efekt izničili.
• Še ena pomanjkljivost se izkaže pri dinamičnem pozicioniranju zvoka od spredaj na
surround. Pri tem se zdi, kakor da zvok potuje od spredaj na stran in ne od spredaj nazaj.
Diskretni zadnji zvočniki ali celo sistemi 7.1-10.2 to zmorejo bolje.
Večina kinematografov ima zvočna polja razdeljena v štiri skupine: levo, levo-zadaj, desno in
desno-zadaj. Pri 5.1 sta skupini levo in levo-zadaj krmiljeni z levim kanalom surround,
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 21
podobno velja za desno stran. Za zvočne zapise, ki imajo ločeni zadnji kanal, pa se polje
razdeli na tri skupine: levo, zadaj in desno. Prednost tega je, da lahko dosežemo dinamično
pozicioniranje od spredaj preko strani in nazaj, kar s konvencionalnim levim in desnim
surroundom z uporabo polja zvočnikov ni mogoče.
Dvosmerni zvočniki surround
Poleg diskretnih usmerjenih zočnikov in polja zvočnikov poznamo tudi zvočnike s posebnim
sevalnim vzorcem. To je par dipolnih zvočnikov (zvočnik, ki oddaja v dve smeri),
nameščenih po standardni postavitvi tako, da oddajata zvok tangencialno na smer poslušanja.
Ideja je izboljšati obkroženost z zvokom kanala surround, saj na ta način pridobimo veliko
odbitih zvokov z vseh smeri. To predvsem dobro deluje v prostorih, za katere je bil sistem
načrtovan, to je domače okolje brez posebne akustične prilagoditve. (Holman, 2008)
4.4 Časovna nastavitev posameznih izhodov za zvočnike
Nekateri boljši sistemi za hišni kino omogočajo nastavitev časovne zakasnitve za posamezne
zvočnike. To je zelo uporabna funkcija, ko nimamo možnosti razporediti zvočnike po
krožnici, kot smo opisali v standardni postavitvi. Če recimo centra ne moremo premakniti
nazaj in so sprednji trije zvočniki v liniji, lahko s časovnim zamikom dosežemo, da zvok iz
tega zvočnika pride do naših ušes v enakem trenutku kot iz levega in desnega zvočnika.
Glavna prednost tega početja pa se skriva v ustvarjanju navideznih slik med zvočniki. V
primeru kot zgoraj, vendar brez časovne zakasnitve, ko poslušamo dinamično pozicioniran
zvok in je le-ta na pol poti med levim in centralnim zvočnikom, ga bomo dojeli, kot da je
bližje centru. To se zgodi zaradi različnih razdalj. Ko še naprej spremljamo ta zvok, se nam
zdi, kakor da se nekaj časa zadržuje na sredini in potem sunkovito skoči na desni zvočnik.
Tako opazimo, da center na nek način jemlje prednost levemu in desnemu zvočniku. Temu se
izognemo s pravilno časovno zakasnitvijo, v tem primeru sredinskega zvočnika. (Holman,
2008)
Zvok potuje s hitrostjo ~340 m/s pri sobni temperaturi in na morski gladini. Torej v primeru,
ko se center nahaja 30 cm bliže kot levi in desni zvočnik, potrebujemo zakasnitev ~1,1 ms.
Ker zakasnitev v večini primerov lahko nastavljamo po 1 ms, bo to kar prava nastavitev. Po
tem postopku nastavimo vse prisotne zvočnike. Da pa uporabniku ni treba preračunavati
časovnih zakasnitev, so proizvajalci naredili še korak dlje. Tako nekateri sistemi omogočajo
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 22
vnos razdalj zvočnikov od slišnega položaja, kar služi kot referenca za samodejno
prilagoditev časovnih zakasnitev.
4.5 LFE – kanal 0.1
LFE ali kanal izboljšanja nizkih frekvenc (angl. Low Frequency Enhancement), imenovan
tudi kanal 0.1, je popolnoma drugačen od katerega koli zvočnega kanala, ki je obstajal pred
njim. Omogoča mnogo več uporabnega prostora na nizkih frekvencah, kot je bilo to možno v
tradicionalnih formatih. V tem frekvenčnem območju je uho manj občutljivo na absolutne
nivoje, bolj pa na relativne spremembe samih nivojev.
Prav je, da na tem mestu razčistimo pomen različnih imen za obravnavani kanal. Že v prvem
poglavju smo ugotovili, da se je dotični kanal sprva imenoval Baby Boom. Ko pa se je v
filmski industriji začel uporabljati digitalni avdio, se je za prostorski zvok pojavilo ime 5.1, s
čimer se je Baby Boom preimenoval v 0.1.
Tako je svoj predlog za ime večkanalnega zvoka 5.1 na sestanku podkomiteja SMPTE,
imenovanega Digital Sound on Film, oktobra 1987 opisal Tomlinson Holman: »Pojavilo se je
vprašanje o številu kanalov, odgovori so se glasili od 4 do 8. Ko sem izgovoril 5.1, so me vsi
pogledali, kakor da bi si mislili, da sem zmešan. Pojasnil sem, da ta dodaten kanal, ki nosi
pomembne informacije za posebno nizkofrekvenčno zmogljivost, zavzema le delček podatkov
v primerjavi s katerim od glavnih kanalov. V bistvu predstavlja le 1/200 kanala, ker je lahko
hitrost vzorčenja 1/200 hitrosti vzorčenja glavnega kanala (hitrost vzorčenja 240 Hz in
pasovna širina 120 Hz za 48 kHz hitrost vzorčenja glavnega kanala), toda število 5.005 ni šlo
z jezika kakor 5.1.« (Holman, 2008, 56)
S tem ko se je sistem 5.1 impliciral tudi v sfero digitalne televizije, se je pojavilo ime LFE
(Low Frequency Enhancement). »Dekodiranje kanala LFE je opcijsko na strani sprejemnika.
Kanal LFE zagotavlja pogrešljivo izboljšavo nizkofrekvenčnih efektov, vendar na 10 dB
višjih nivojih kot preostali avdio kanali. Reprodukcija tega kanala ni bistvena za uživanje ob
programu in je lahko škodljiva, če reprodukcijska oprema ne more obvladovati visokih
nivojev nizkofrekvenčne zvočne energije. Tipični sprejemniki lahko tako dekodirajo in
predvajajo le pet avdio kanalov in ne šest (pri čemer šteje 0.1 kot en kanal).« (ATSC, 2010)
Podobno velja tudi za reprodukcijo videa v domačem kinu.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 23
Iz tega lahko sklepamo, da ne smemo aplicirati zvokov, ki so pomembni za pripoved, samo na
kanal LFE.
Uporaben prostor na mediju
Poleg uporabe več zvočnikov za nizke frekvence se je v sedemdesetih letih porodila še ena
ideja. Ker je bil prostor na magnetnih trakovih še vedno enak kot poprej, so se odločili, da
bodo jakost ob snemanju nizkofrekvenčnega materiala znižali za 10 dB, nato pa s pomočjo
kinematografskih naprav le-to ponovno zvišali za 10 dB. Tako so pridobili več prostora za
nizke frekvence, vendar so s tem povišali verjetnost za nizkofrekvenčni šum. Le-tega se je
dalo z nizkim sitom (angl. low-pass filter) uspešno reducirati. Na tak način izkoriščen prostor
je omogočil čisto novo obliko izražanja ter s tem povezane kinematografske izkušnje.
(Holman 2008)
Ideja, ki omogoča večji zvokovni razpon (angl. headroom) na nizkih frekvencah, se je
izkazala za koristno. Moderna psihoakustika nam dokazuje, da človeško uho na nizkih
frekvencah rabi višji zvočni pritisk v dB, da jih dojamemo enako glasne kot srednje in visoke
frekvence. To je razvidno iz krivulj enake glasnosti, ki so objavljene kot standard ISO
226:2003. Ob pogledu na krivulje na sliki 4.4 je razvidno, koliko več pritiska je potrebnega
pri nizkih napram srednjim in visokim frekvencam, da poustvarijo občutek enake glasnosti.
Slika 4.4: Krivulje enake glasnosti (Holman, 2008)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 24
5 PSIHOAKUSTIKA
Psihoakustika se ukvarja s človekovim dojemanjem zvoka. Vključuje fizično interakcijo med
zvočnim poljem in človeško glavo, zunanjimi ušesi in ušesnim kanalom. Prav tako obravnava
spremembo zvočne energije v živčne impulze, ki se zgodi v notranjem ušesu, ter interpretacijo
teh signalov, ki se odvija v možganih. Slišni mehanizem zazna razliko 10 µs zamika zvoka
med dvema ušesoma, sliši preko 10 oktav frekvenčnega razpona (razpon vidnega valovanja je
manj kot 1 oktava) in to pri ogromnem dinamičnem razponu. Vse to nam da slutiti, da je
človeški sluh zapleten mehanizem.
Osnovni mehanizmi lokalizacije
Lokalizacija v psihoakustiki predstavlja zmožnost odkrivanja položaja izvora zvočnega
valovanja. Ker je človeški slišni razpon tako širok, je človeška glava lahko s tega stališča le
majhen predmet pri nizkih frekvencah ali velik predmet pri visokih frekvencah, kot prikazuje
slika 5.1. Pri najnižjih slišnih frekvencah, kjer je dolžina zvočnega vala 15 m, se glava pojavi
kot drobcen objekt, okrog katerega se zvok z lahkoto ovije, temu pravimo difrakcija. Pri
najvišjih slišnih frekvencah, kjer je dolžina zvočnega vala 25 mm, se glava pojavi kot velik
objekt, ki se v nasprotju s prejšnjim primerom obnaša bolj kot prepreka. Čeprav še vedno
prihaja do difrakcije zvoka, se na strani glave, nasprotni od izvora zvoka, ustvari tako
imenovana akustična senca.
Slika 5.1: Nizke in visoke frekvence v primerjavi s človeško glavo (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 25
Človeška glava po dimenzijah nekako sovpada s srednjimi frekvencami. To nam da slutiti, da
en sam mehanizem ne bo zmogel pokrivati celotnega frekvenčnega območja, ker se stvari s
spremembo frekvence preveč spreminjajo. (Holman, 2008)
Pri nizkih frekvencah so razlike v glasnosti zvoka, ne glede na lokacijo izvora, nizke zaradi že
omenjenega dejstva, da se valovi prosto gibljejo okrog glave. (Thiele, Kügler, 1992) Ker so te
razlike majhne, bi bila lokalizacija samo na osnovi tega mehanizma zelo slaba. Zato
lokalizacija pri nizkih frekvencah deluje na osnovi razlike v času prihoda vala med obema
ušesoma. Tako se dejansko triangulira smer izvora zvoka. Ta mehanizem se imenuje
medušesna časovna razlika (angl. Interaural Time Difference), v nadaljevanju ITD.
Pri visokih frekvencah se, kot smo že napisali, glava obnaša kot nekakšna prepreka in zato se
jakost zvoka spreminja glede na kot, pod katerim se nahaja izvor. To se imenuje medušesna
jakostna razlika (angl. Interaural Level Difference), v nadaljevanju ILD. Pri visokih
frekvencah časovna razlika ne igra več tako velike vloge, ker nalogo lokalizacije prevzame
jakostna razlika.
Ta dva sistema sta zaslužna za velik del lokalizacije, vendar pa vseeno zaznamo tudi razliko v
smeri zvokov, ki na obe ušesi ustvarjajo identične signale, v primeru, da se nahajajo direktno
pred nami, nad nami ali za nami. To logično rezultira v enakem ITD in tudi ILD. Kako potem
vseeno zaznamo razliko? Odgovor se skriva v obliki našega zunanjega ušesa – uhlja, ki se v
interakciji z zvoki iz različnih smeri obnaša drugače. To pomeni spremembe v frekvenčnem
razponu, ki je posledica kombinacije različnih resonanc in odmevov, ki je edinstvena za vsako
smer. Tako nam oblika zunanjega ušesa pomaga tudi pri določanju višine. (Holman, 2008)
Kombinacija ITD, ILD in oblike zunanjega ušesa vpliva na komplicirano vrsto odzivov, ki se
spreminjajo skupaj s spremembo kota med zvočnim poljem in poslušalčevo glavo. To je
razvidno že iz tega, da je zvok, ki vsebuje vrsto različnih frekvenc, slišati čistejši v primeru,
ko prihaja direktno z leve ali desne strani, kakor v primeru, da prihaja od spredaj ali zadaj.
Kompleksno teorijo, ki se ukvarja s frekvenčnimi in časovnimi odzivi zvočnih polj v obeh
ušesnih kanalih, ki izvirajo iz določene smeri, bomo označevali s kratico HRTF (angl. Head-
Related Transfer Function). (http://en.wikipedia.org/wiki/Head-related_transfer_function)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 26
Minimalni slišni kot
Minimalni slišni kot je kot, pri katerem lahko zaznamo razliko v smeri, iz katere izvira zvočno
valovanje. Najmanjši je spredaj pred glavo in znaša 1° po horizontalni ravnini in 3° po
vertikalni ravnini. Kot ostaja dokaj natančen na zgornjem delu ravnine pred glavo in se hitro
slabša proti stranem in nazaj od glave. Na osnovi tega odkritja psihoakustično zasnovani
večkanalni sistemi uporabljajo več sprednjih kot zadnjih kanalov. (Holman, 2008)
Upravljanje nizkih tonov in LFE
Lokalizacija ni enako dobra pri vseh frekvencah. Mnogo slabša je pri nizkih frekvencah, kar
vodi do praktične rešitve za sisteme, ki vključujejo nizkotonski zvočnik. Pri teh se nizke
frekvence izluščijo iz vseh kanalov, se med seboj seštejejo ter se nato preusmerijo v zvočnik.
Kanal LFE predstavlja od produkcije do končne uporabe vedno ločen kanal na mediju. 10 dB
večji zvočni razpon je pomemben zaradi tega, ker nizki toni zavzamejo več prostora v
posnetku. Posledica zvišanja zvočnega razpona je za 10 dB znižano razmerje SNR, toda tu je
govora o frekvencah pod 120 Hz, kjer je človeški sluh skorajda neobčutljiv za šum. Na
področju filma se uporablja samo kanal LFE, ki krmili nizkotonske zvočnike v
kinematografih. Na področju televizije in videa pa kanal LFE skupaj z upravljanjem nizkih
tonov, zananim tudi pod imenom Bass Management, krmili nizkotonski zvočnik. (Holman,
2008)
Vplivi lokalizacijskih mehanizmov na 5.1-kanalni zvok
»Zvok, ki izvira iz zvočnika surround, ima drugačen zven kot isti zvok, ki izvira iz
centralnega zvočnika. To drži tudi v primeru popolnoma enakih zvočnikov in je posledica
funkcij HRTF.« (Holman, 2008, 182)
V 'naravnem' poslušanju se te funkcije delno izničijo s človeško percepcijo, saj se zven izvora
ne spremeni glede na kot le-tega. Kot primer lahko vzamemo premikajočega se violinista, ki
igra na svoj inštrument. Čeprav se funkcije HRTF dramatično spreminjajo, ko se glasbenik
premika po prostoru, zaradi izvora in sprejema ter tudi samih funkcij HRTF, nam violina še
vedno zveni isto. V primeru, da bi jo glasbenik zamenjal z drugo, bi to tudi nemudoma
opazili. To je izjemna slušna zmogljivost. Raziskovalci tega efekta, med njimi tudi Arthur H.
Benade, so prišli do možnega zaključka, da za zvok, ki izvira iz katere koli druge smeri poleg
centra, ni potrebne nobene izenačitve. Pogoj naj bi bili le usklajeni zvočniki in akustika
prostora. (Benade, Kent, 1964) Na kratko, pozicioniranje naj ne bi vplivalo na barvo zvoka, ki
izvira kjerkoli okrog poslušalca, vendar temu ni tako.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 27
Zaznavni so različni vplivi: (Holman, 2008)
• Za zvok, pozicioniran na surround, zaznamo drugačen frekvenčni odziv, kot če prihaja iz
centralnega zvočnika. Opišemo ga kot čistejšega.
• Za zvok, pozicioniran na polovici med sprednjim zvočnikom in zvočnikom surround,
zaznamo, kot da del spektra prihaja iz sprednjega, del pa iz zvočnika surround. Zvok se
navidezno raztrga na dva dela in tako ga tudi slišimo.
• Med dinamičnim pozicioniranjem zvoka od sprednjega do zvočnika surround pride do
enake razdelitve signala, ki pa se ponovno združi na končni poziciji.
Vse to so rezultati funkcij HRTF. Muči pa nas vprašanje, zakaj teorija iz 'naravnega'
poslušanja tukaj ne drži? Očiten razlog za to se skriva v dejstvu, da je v našem 'umetnem'
sistemu premalo smeri, ki predstavljajo 'naravno' zvočno polje.
Končna ugotovitev je, da je dopustno izenačevanje zvokov, pozicioniranih na zvočnike
surround, tako da zvenijo dobro. Ta izenačitev bo seveda drugačna kot izenačitev za isti zvok,
ki je pozicioniran na katerega od sprednjih zvočnikov. Ne obstaja pa nobeno pisano pravilo,
kako se takšna izenačitev izvede.
Zakon prve valovne fronte
Poslušalec tipično lokalizira izvor zvoka na podlagi smeri, iz katere je prišel prvi zvok. Zato
človek lahko lokalizira zvok tudi v prostoru z veliko odmeva, v katerem bi se večina
elektronskih naprav hitro zmedla. Za zvok, identičen po jakosti in frekvencah, ki izhaja iz
dveh izvorov, se tvori navidezna slika. V primerih, ko je enak, vendar po jakosti močnejši
zvok kasneje prišel iz drugega izvora, se tudi lahko ustvari navidezna slika. V obeh primerih
pa pomembno vlogo odigra proces preračunavanja lokalizacije.
Ko se direktnemu zvoku pridružujejo dodatni odbiti zvoki iz različnih smeri, se začne
pojavljati vrsta efektov. Na glasnostih najprej zaznamo rahlo spremembo. Ko se glasnost
nekoliko zviša, zaznamo nekakšno razširitev izvora in ob enem tudi morebitno spremembo
barve zvoka. Na še višjih glasnostih pa se pojavi preračunavanje lokalizacije. Pri tem neka
srednja smer med obema izvoroma izgleda kot sam izvor, to je navidezna slika. (Theile, 1980)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 28
Navidezna slika v stereu
Preračunavanje lokalizacije je uporabno v dva in večkanalnih zvočnih sistemih, ki na podlagi
tega principa proizvajajo zvočne slike, ležeče med zvočniki. V 2-kanalnem stereu slišijo
centrirano navidezno sliko osebe z normalnim sluhom, ko sta na levem in desnem zvočniku
proizvedeni identični zvočni polji. Za to je potrebna še uravnovešena akustika prostora, v
katerem na središčnici sedi oseba, obrnjena proti zvočnikoma. (Theile, 1980)
Vendar pa se pri navidezni sliki pojavljata dva problema. Prvi temelji na zakonu prve valovne
fronte. Pri tem se navidezna slika premika skupaj s poslušalcem, če se le-ta giblje naprej ali
nazaj. V primeru premikanja levo in desno pa se ta slika prej ali slej poruši. Zato je uporaba
centra smiselna, saj le-ta deluje kot opora za celotno zvočno polje in s tem omogoča boljše
poslušanje izven srednje pozicije. Vseeno pa je v primeru 5.1-kanalnega sistema še vedno
prisotno spreminjanje navidezne slike med levim in centralnim zvočnikom ter centralnim in
desnim zvočnikom v primeru spreminjanja slušne pozicije, vendar pa so tu zamiki 30° veliko
manjši kot pri 2-kanalnem stereu, kjer znašajo 60°.
Drugi problem je v tem, da se v resnici pojavijo štiri zvočna polja. Pri 2-kanalnem sistemu
levi zvočnik ustvari zvočno polje na levem, prav tako pa tudi na desnem ušesu. Enako velja
tudi za desni zvočnik. V realnosti bi izvor zvoka v centru povzročil le eno zvočno polje,
navidezna slika pa povzroči dve. (Holman, 2008)
Iz vseh teh razlogov je najbolje predvajati direktni zvok iz enega zvočnika namesto dveh, saj
zvok iz dveh zvočnikov ustvari navidezne slike, ki so podvržene efektu prve valovne fronte in
raznim anomalijam v frekvenčnem odzivu.
Prostorskost in vključenost
Prostorski zvok lahko opišemo z dvema pojmoma, to sta prostorskost (angl. spaciousness) in
vključenost (angl. envelopment).
Prostorskost predstavlja s pomočjo zvoka prikazano velikost prostora. V principu jo določa
razmerje med direktnim zvokom in odmevi. Slišna je lahko tako na 2-kanalnih kot 5-kanalnih
sistemih. Na 2-kanalnem sistemu je omejena na prostor med obema zvočnikoma. Prostorskost
se v tem primeru predstavlja kot fizični svet med zvočnikoma. Vključena je globinska
dimenzija, vendar se razprostira samo med dvema zvočnikoma.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 29
Vključenost pa pomeni dejansko biti obkrožen z zvokom, kar za reprodukcijo zahteva
večkanalni zvočni sistem. 2-kanalni stereo lahko poustvari občutek gledanja v prostor za
zvočniki, večkanalni sistem pa poustvari občutek biti v prikazanem prostoru. (Holman, 2008)
Po 5.1
Sistem 5.1 je v kinematografski uporabi že več kot tri desetletja in že kar lep čas tudi v
domači uporabi. Sploh v domači uporabi, tako imenovanem hišnem kinu, se uporaba še vedno
širi.
Znano je, da oseba z normalnim sluhom sliši razliko med mono in stereo zvokom ter da je
razlika zelo opazna. Nekoliko manj raziskano je dejstvo, da praktično vsakdo lahko zazna
razliko med stereom in surroundom. Tudi tu je zaznana precejšnja izboljšava v zvoku. Konca
razvoja trenutno še ni na obzorju, zato pričakujemo, da bo število kanalov še naraščalo do
meje, kjer bodo nadaljne izboljšave precej odvisne od finančnih sredstev. Sistem 5.1 je samo
ena točka na tej poti razvoja. »Po primerjavah sistemov 1, 2, 5.1 in 10.2 so raziskovalci prišli
do rezultatov, da so udeleženci testiranj opazili največjo razliko med 2 in 5.1, medtem ko
skorajda nihče ne zazna razlike med 5.1 in 10.2. Vsekakor je veliko ustvarjalcev mnenja, da
meja percepcije še ni dosežena, zato eksperimentirajo z vedno večimi kanali, naprimer 22.2.«
(Holman, 2008, 191)
En način, kako gledati na naslednji korak po 5.1, je ta, da naj bi bila opazna velika
psihoakustična izboljšava. Izpostaviti točke, kjer se sistem 5.1 dobro odreže in kjer ima
pomankljivosti, namiguje, kako uporabiti dodatne kanale: (Holman, 2008)
• Stranski (angl. wide) kanali, ki naj bi dobro reproducirali smer, jakost in časovno
usklajenost zgodnjih odbojev, so koristni. Pri uporabi teh kanalov je bila odkrita
nepričakovana pozitivna lastnost. To je dobro reproduciranje zvoka ob dinamičnem
pozicioniranju od levega preko levega stranskega do levega kanala surround, pri katerem
se navidezna slika tekoče giblje po levi strani. Zaradi simetrične postavitve velja enako
tudi za desno stran. To je lastnost, kateri sistem 5.1 podleže zaradi že opisane porušitve
navidezne slike.
• Zadnji centralni kanal je uporaben za zapolnitev zadnje vrzeli med zvočniki surround, ki
se, kot vemo, nahajajo na 110° ob strani, tako da je vrzel široka celih 140°. To izboljša
proizvajanje zadnjih navideznih slik in tudi samo vključenost.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 30
• Potem ko so zgoraj opisani trije kanali dodani k standardnim petim, bi najverjetneje bilo
treba horizontalno ravnino dodatno razširiti zavoljo višinskega efekta. Le tega pogrešamo
tako pri stereu kot pri večini večkanalnih sistemov. Dva zvočnika, na široko postavljena
pred in nad horizontalno ravnino, sta uporabna za ponazoritev višinske komponente.
• Kanal 0.1 je lahko razširjen za reprodukcijo na več ločenih basovskih zvočnikov z
namenom omehčati frekvenčni odziv.
Ko vse to seštejemo, se 10.2 izkaže za naslednji logični korak. Na tem sistemu dela ameriški
laboratorij THM v sodelovanju z Univerzo v Južni Kaliforniji.
(http://en.wikipedia.org/wiki/10.2) Blauert (1999) trdi, da bi za fiksno slušno pozicijo bilo
potrebnih 30 kanalov, kar naj bi zadoščalo za vtis popolne vključenosti. Tako je 5.1 velik
korak naprej od sterea, prav tako pa je 10.2 korak na poti do popolne reprodukcije zvočnega
polja.
Dandanes je na večini medijev število kanalov fiksirano na 5.1. Vseeno pa obstaja tendenca
po zvišanju tega števila. Tako bo v prihodnosti številka gotovo narasla, prav pa bodo prišle
tudi tehnike, ki so zmožne izluščiti stereo iz 5.1 zapisov. Tako bi bilo možno preko že
obstoječih sistemov 5.1 predvajati zapise 10.2.
Poizkusi se izvajajo tudi na drugih sistemih. Japonska korporacija NHK se ukvarja z 22.2-
kanalnim sistemom. (http://en.wikipedia.org/wiki/22.2) Evropski inštitut Fraunhofer razvija
sistem Iosono z 200 zvočniki, ki naj bi predstavljali neskončnost v kinematografski
namestitvi. (http://www.iosono-sound.com)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 31
6 ZVOK ZA ANIMACIJO
Šele z možnostjo sinhronizacije zvoka s filmom je slednji pridobil svojo pravo pripovedno
moč. Govor, glasba in posebni efekti so pripomogli k osvoboditvi igralcev od pretirane
mimike, značilne za tako imenovano tiho dobo. Ustvarjena je bila originalna glasbena podlaga
za film. Posebni efekti, uporabljeni v radijski drami, so bili hitro aplicirani. Največji pomen
pa je dal seveda sinhronizirani govor. (Beauchamp, 2005) Vsi ti elementi sestavljajo zvočni
zapis, ki se razvija skozi celoten proces nastajanja animacije. Na tak način pazljivo zgradimo
zvočno sliko, katere posamezni elementi imajo točno določen namen v podajanju vsebine.
6.1 Govor
V animaciji, kakor tudi v filmu, se lahko govor pojavi v zelo različnih oblikah. Najbolj
razširjen je seveda dialog med nastopajočimi liki, ki pa ni vedno zgolj posnet govor. V
nekaterih animacijah nastopajo izmišljena bitja, za katera izdelamo posebne sintetične jezike.
Najenostavnejši način je uporaba stavkov v različnih svetovnih jezikih, ki jih predvajamo
nazaj. S tem dosežemo logično strukturo jezika, vendar ta postane nerazumljiv. Nadalje lahko
procesiramo signal z različnimi harmonijami in zvenskimi modulacijami, da dobimo razne
robotske in elektronske zvoke. Da pa vse skupaj ni slišati povsem nerazumljivo, na določenih
mestih dodamo delce prepoznavnega govora, s čimer ustvarimo oprijemljive točke.
S stališča naracije pa je pomembno tudi pripovedovanje. V kinematografski verziji
pripovedovanja nastopi neviden pripovedovalec z namenom podati pomembne točke v
zgodbi, mnogokrat pa tudi uvede zgodbo, kar prispeva k pravljičnosti filma. Pripovedovanje
se lahko vrši v prvi ali v tretji osebi. V prvi osebi poteka v primeru, ko gre za pripovedovanje
misli lika. V tretji osebi pa predstavlja zunanjega opazovalca, ne pa udeleženca v zgodbi,
vendar s pravilnim pristopom učinkovito povede gledalca v dogajanje. (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 32
Snemanje
Najboljše rezultate pri smemanju zvoka dosežemo, če delo opravimo v specializiranem studiu,
v katerem lahko uporabljamo kakovostne mikrofone in ima dobro prilagojene snemalne
prostore. Cenejša alternativa je lahko uporaba prenosnega računalnika z zunanjo zvočno
kartico, ki z malo spretnosti lahko postane zmogljiva prenosna avdio obdelovalna enota.
Uporaba mikrofona
Govor snemamo ponavadi z razdalje 20-25 centimetrov, pri čemer je mikrofon usmerjen pod
rahlim kotom navzdol in malce nad višino nosu. Pri tem uporabimo tudi ščit, s katerim
preprečimo udarjanje zraka ob mikrofon in s tem pokanje v posnetku. Govor snemamo po
posameznih stavkih ali frazah, ki jih posnamemo večkrat. Posnetke shranimo za nadaljnjo
uporabo, h kateri štejemo tudi 3D modelirnike, s katerimi potem sinhroniziramo like. V veliko
pomoč je tudi video posnetek govorca, ki služi kot referenca za animiranje lika.
Urejanje
Urejanje posnetkov zahteva posebno pozornost, saj so s premiki ust ustvarjeni subtilni zvoki
predvsem na začetku ali koncu besed ali fraz. Njihova jakost je tako majhna, da jih večina
avdio urejevalnikov niti ne prikaže. Lahko se zgodi, da jih enostavno odrežemo, vendar po
tem besede zvenijo nenaravno. Tudi dihanje je naraven pojav in se včasih zlije z besedo, zato
ga ne poskušamo odstraniti, po potrebi ga le nekoliko utišamo. Urejevalniki nam ponujajo
možnost povečave prikaza valovnega zapisa, kar lahko s pridom uporabimo za kontrolo pred
editiranjem posnetka. (Yewdall, 1999)
Procesiranje signala
Govorni signal procesiramo v zaključni fazi mešanaja zvoka kot korekturni poseg za
dokončno izoblikovanje zvoka in pozicioniranje le-tega v zanj predviden prostor v celotni
zvočni sliki.
Popravki
• Izboljšanje razumljivosti: Določene frekvence v govoru lahko izboljšajo ali poslabšajo
razumljivost. Pomembne so frekvence okrog 250 Hz, ki jim znižamo moč, če je govor
preveč agresiven, ali jih pojačamo, če rabimo več topline. Frekvence okrog 4 kHz so
znane kot frekvence prisotnosti, zato s povečanjem jakosti na tem mestu izboljšamo
razumljivost in postavimo govor v ospredje.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 33
• Odstranjevanje šuma: Z izjemo zelo nizkih moških glasov govor ne vsebuje pomembnih
komponent pod 100 Hz, zato lahko do tega območja odstranimo frekvence s pomočjo
izenačevalnika (angl. equalizer). Prehod (angl. gate) je lahko uporabljen za odstranjevanje
tišjih šumov v premorih.
• Preprečevanje maskiranja frekvenc: Glasba za ozadje pogosto vsebuje frekvence na
območju govora. Za ta primer uporabimo izenačevalnik, tako da porežemo frekvence v
glasbeni podlagi, ki bi zmanjšale razumljivost govora.
• Kontrola dinamičnega razpona: Za govor je značilno, da ima ozek frekvenčni razpon, za
ustvarjanje poudarkov pa se zanaša na dinamični razpon. Govor s pretiranim razponom
postane težak za vključitev pri mešanju zvoka. Dobro izučeni govorci nam ne bodo
povzročali posebnih težav, za nekoliko manj izkušene pa imamo možnost uporabe
dinamične kompresije. Kompresor reducira preveč izrazite vrhove dialoga in hkrati ojača
jakost celotnega signala. Tako najtišji segmenti postanejo bolje slišni. Z uporabo tega
postopka pa ne smemo pretiravati. Če nam ne uspe s kompresorejm, je bolje, da vse ostale
zvoke nekoliko utišamo, da napravimo prostor za govor. (Beauchamp, 2005)
Oblikovanje
Kot smo že opisali v poglavju o ustvarjanju sintetičnih jezikov, imamo pri oblikovanju zvoka
z različnimi efekti neomejene možnosti, vendar vedno pazimo na razumljivost govora.
Govor in glasba
Glasba za ozadje vsebuje več elementov, ki lahko govoru odvzamejo razumljivost ali ga
poudarijo. Melodija lahko kaj kmalu potegne pozornost nase, zato se komponisti izogibajo
pisanju aktivnih melodij za podlago govoru. Edina izjema je poudarjanje dramatičnosti
posameznih besed ravno s pomočjo določenih tonov. Ti skupaj z govorom delujejo kot zvočni
efekt. Pesmi v nasprotju z glasbo za ozadje vsebujejo še besedila, zato je čas zanje rezerviran
v sekvencah brez govora.
6.2 Glasba
Pojem soundtrack za končne uporabnike pomeni filmsko glasbo. Filmska industrija pa isti
pojem uporablja za poimenovanje zvočnega zapisa, ki vključuje govor, zvočne efekte in
glasbo. Glasbeni del soundtracka je komponiran in predstavlja le en element soundtracka, ki
je grajen.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 34
6.2.1 Pomen glasbe v animaciji
»Če je animacija vdih življenja v like, potem je glasba infuzija emocij tem likom. Predstavlja
močno orodje, s katerim lahko izzovemo čustva. Filozofi verjamejo, da je glasba simbolična
predstava naših subjektivnih čustev.« (Beauchamp, 2005, 43) Občinstvo pritegne glasba, ki
odseva njegovo osebnost in duševno stanje ter zapolnjuje vsakodnevno življenje. Določene
pesmi lahko postanejo človekova simbolična povezava do njegovih osebnih izkušenj in
čustev, kar lahko izzove podoživljanje določenih dogodkov in z njimi povezanih čustev. To je
tudi razlog, da razvijemo originalno glasbo, s katero se izognemo morebitnim asociacijam in
tako uspešno usmerjamo izkušnjo občinstva.
Že v tihi dobi so filmski ustvarjalci spoznali pomen glasbe v odnosu do filma. Tako so
glasbeni založniki že takrat začeli ustvarjati glasbene knjižnice, sortirane glede na
dramatičnost same glasbe. (Beauchamp, 2005)
Pomembno je vedeti, da glasba za poslušanje razvija svojo formo in s tem pomen neodvisno
od slike. Nasprotno pa filmska glasba razvija svojo formo na podlagi filmske pripovedi.
Glasba za podlago
Zvočni efekti predstavljajo likov zunanji svet, glasbena podlaga pa poudarja njegov notranji –
čustveni svet. Glasba izzove gledalca, da vse to zazna in se odzove na podano vsebino. V
začetni dobi sinhroniziranega zvoka so mnogi režiserji verjeli, da bo občinstvo zavrglo
glasbeno podlago. V resnici pa je občinstvo takoj sprejelo glasbeno podlago kot del
kinematografske izkušnje, zato je le-ta postala prevladujoč del filmskega zvoka. (Beauchamp,
2005) Glasba za podlago je skoraj vedno originalna glasba, prikrojena po dolžini in k
nastopajočemu liku, tako da podpira pripoved. Lahko je tematska ali ambientalna. Mnogokrat
nadomešča resnične zvoke okolja ter tako ustvarja zvočno ozadje, ki podpira fantazijo in
sproža emocionalne odzive. Ker po naravi ne potrebuje vizualne reference, se ji ni treba
prilagajati na spremembe scene ali postavitve kamere. Iztočnice so določene tako, da gledalca
uvede v sceno ali poda občutek zaključka scene in tako tudi ublaži prehode. Glasba lahko s
samo nekaj notami opiše čustveni svet, česar govor ni zmožen z vsemi znanimi besedami.
Glasba iz določenih izvorov
Glasba iz določenih izvorov je glasba, ki jo zaznajo tako nastopajoči liki kot gledalci in
vzpodbuja realizem. Primeri take glasbe znotraj filma so radio, televizija, nastopi v živo in
sistemi zvočnega javnega obveščanja. Lahko se pojavi na ali izven zaslona in je linearna in
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 35
hkrati tematska. Iztočne točke so podane tekom dogajanja, s čimer izražajo vzporednost
akcije. Uporabna tehnika je tudi iztočnica pred začetkom scene z namenom uvajanja v novo
sceno. Glasba je ponavadi mono signal in je procesirana tako, da se zliva v okolje, poleg tega
je pozicionirana na določeno pozicijo na zaslonu. Ko je v glasbi prisoten vokal, se le-ta
pojavlja v povezavi z zgodbo. Tudi popularna glasba je kot orodje uporabljena za vzbujanje
občutkov, povezanih z že obstoječimi kulturnimi in dobesednimi pomeni. (Peacock, 2001)
Glasbeni efekti in efekti iz glasbe za podlago
Predvsem v preteklosti se je glasba za podlago uporabljala kot dodatni efekt. Najbolj znan je
primer utripa oči, ki ga spremlja zvok ksilofona. Pogosta je tudi uporaba lestvice tonov, ki
poudarjajo dogajanje, ko se lik sprehodi navzgor ali navzdol po stopnicah. Ritmična glasba
ponavadi spremlja ponavljajoče se dogajanje, kot je naprimer hoja v krogu, odbijanje žoge in
podobno. (Beauchamp, 2005) Kot smo že ugotovili, so zaporedja tonov uporabljena kot
ponazarjanje smeri gibanja, medtem ko s spreminjanjem glasnosti ponazarjamo približno
lokacijo in intenziteto.
Glasba za emocionalno obravnavo
Uporaba glasbe za doseganje čustvenega efekta predpostavlja, da glasba vsebuje elemente, ki
so tako naravni, da pri občinstvu izzovejo univerzalni odziv. Ugotovljeno je, da obstaja
podobnost v reakciji med različnimi občinstvi, čeprav ni čisto jasno, zakaj je temu tako.
Najbrž pride pri združitvi glasbe in slike do zadostne redukcije subjektivnosti, tako dobi
glasba moč, da izzove in usmerja naša čustva. Možno bi bilo tudi, da je dosledno združevanje
glasbe s scenami pripeljalo do te kinematografske konvencije. Te asociacije pa so z razvojem
in širjenjem filma po svetu postale vse bolj univerzalne. (Beauchamp, 2005)
Glasba za kontinuiteto in zaznavo časa
Glasba lahko poudarja kontinuiteto v animaciji na mnogo načinov. En od teh načinov je tako
imenovani leitmotiv. (Peacock, 2001) To je glasbena fraza, ki je tekom filma dosledno
pripisana liku, predmetu ali dogodku. Ponavljanje leitmotiva zagotavlja znane oporne točke v
zgodbi, ki se sicer nenehno spreminja. Podobno kot leitmotiv lahko k določenemu liku spada
tudi določen glasbeni instrument. Kontrastne partiture v povezavi s prebliski in rezi
poudarjajo skoke v časovnem kontinuumu. Tek časa je mnogokrat impliciran s hitrostjo ritma
glasbe v navezi s sliko. To je še posebej opazno v scenah raznih pregonov, kjer posamezni
posnetki dajejo občutek različnih hitrosti.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 36
Glasba za vzpostavitev nastavitve in razsežnosti prizora
Mnogo glasbenih stilov je poimenovanih po časovnem obdobju, iz katerega izvirajo. Tako
vsak stil, igran na klasične inštrumente, pomaga pri vzpostavitvi scene. Tudi glasba za
podlago ima velik pomen pri vzpostavitvi razsežnosti. Z uporabo inštrumentacije velikega
orkestra vzpostavimo prizor epskih razsežnosti, medtem ko z uporabo manj ali samo enega
inštrumenta ustvarimo pridih intime. (Peacock, 2001)
6.2.2 Kreiranje glasbe
Ustvarjanje originalne glasbe
Za glasbeno podlago želimo glasbo, ki je ekskluzivna, prikrojena sliki in osvobojena že
obstoječih asociacij. (Beauchamp, 2005) Filmski skladatelji se od klasičnih ločijo po
izrazitem občutku za dramatičnost. Poleg tega morajo biti sposobni pisati v poljubnem slogu.
Pogosto dobijo nalogo napisati glasbo po zgledu začasnega posnetka, pri čemer se morajo
izogniti plagiatorstvu.
Akustična in sintetična inštrumentacija
Akustično zaigrani zvoki so avtomatsko povezani z organskim naravnim okoljem. Sintetično
generirani zvoki pa predstavljajo nasprotje, torej mehansko in tehnološko okolje. Po drugi
strani pa je glasba zaigrana na klavir ali violino postala vsesplošno sprejeta in zato lahko
postane brezčasna in transparentna. Sintetično ustvarjena glasba lahko izvrstno pripomore k
pripovedi, vendar se lahko zgodi, da trenutno moderen zvok nekoč postane zastarel, kar se v
primeru klasičnih instrumentov težje pripeti. V večini projektov se elektronska in akustična
plat združita. Elektronski del soundtracka obenem poskrbi za ustrezne oporne točke oziroma
za časovno sinhronizacijo akustično odigranim zvokom.
Produkcijske glasbene knjižnice
Z uporabo glasbenih knjižnic se izognemo precejšnjim stroškom, ki se pojavijo v primeru
unikatne glasbe. Glasba, ki jo vsebujejo takšne komercialne knjižnice, je predvidena za
uporabo v avdio vizualni produkciji. Kot pri večini produkcijskih sklopov je tudi kakovost
glasbe pogojena s ceno. Vsekakor pa se glasba iz knjižnic vse pogosteje uporablja tako v
nizko, kot visokoproračunskih projektih. Vedno pa se najdejo tudi izjeme, ki se poslužujejo
zgolj lastne avdio produkcije. (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 37
Prednosti uporabe knjižnic so:
• hitrejša in cenejša produkcija kot ustvarjanje originalne glasbe,
• glasba je lahko potrjena, preden jo dejansko odkupimo,
• kar slišiš, to dobiš,
• glasba je lahko uporabljena kot začasni posnetek in po odobritvi ostane v projektu,
• dosegljivost preko spleta omogoča izvedbo znotraj časovnega plana,
• izbori so predhodno prijavljeni za namen javnega predvajanja.
Slabosti uporabe knjižnic pa so:
• tempo včasih ne sovpada s hitrostjo scene,
• ni ekskluzive – isti zvoki se lahko pojavijo v konkurenčnih projektih,
• glasba ni napisana posebej za sceno, zato je potrebno urejanje,
• na izbiro imamo le omejeno število variacij izbora, zato je otežena uporaba z vidika
kontinuitete.
Osnovne operacije urejanja glasbe
Preliv (angl. fade) je osnova vsakega editiranja. Uporablja se za glajenje razlik v amplitudi in
preprečevanje tako imenovanih pokov ob prehodih. Navzkrižni preliv (angl. crossfade) je
prehod med dvema različnima zvokoma, tako da se ujemata v glasnosti in po potrebi tudi v
hitrosti.
Pri delu z glasbo, pridobljeno iz knjižnic, se rezom (angl. cut) skorajda ne moremo izogniti.
Zato je potrebno paziti, da sami po sebi ne privlačijo preveč pozornosti. Pri rezu v posebej
glasnem delu zvoka je priporočljivo uporabiti reverb tik pred njim. Tako efekt, ki se v tem
trenutku pojavi, ustvari iluzijo naravnega izteka zvoka.
Časovno raztezanje in stiskanje (angl. time expansion; time compression) omogoča
spremembo trajanja celotnega izbora. S tem lahko prilagodimo trajanje glasbe na določeno
dolžino. Z dodatnimi funkcijami lahko poustvarimo tudi povečevanje ali zmanjševanje tempa
skladbe.
Izrez (angl. intercut) je predvsem uporaben, ko se želimo znebiti določenega dela skladbe, da
celoto prilagodimo na želeno dolžino. Na tak način lahko obdržimo naravni začetek in konec
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 38
skladbe. Pri tem moramo paziti, da je ustvarjen prehod čim manj opazen. Na to zelo vplivajo
morebiten prisoten vokal, prisotni inštrumenti in spremenjena hitrost. (Yewdall, 1999)
6.3 Posebni efekti
Zvočni efekti so učinkovit način vzpostavitve pripovednih elementov, kot so lokacija,
časovno obdobje in razvoj samega lika. Naprimer galebi pomenijo morje, promet mesto in
stroji tovarno. Sirene iz druge svetovne vojne ali parna lokomotiva poneseta dogajanje v
določeno zgodovinsko časovno obdobje. Tudi v primeru žvižga piščalke takoj ugotovimo, da
gre za lik policaja ali mogoče v primeru tipkanja na pisalni stroj za novinarja. Veliko zvokov
pri občinstvu izzove emocionalni odziv, povezan z asociacijo na sam zvok. Kot primer lahko
vzamemo ropotanje klopotače, rjovenje leva, ali jok sirote. Ti zvoki so v večini primerov
dodani k že obstoječim efektom z namenom usmerjati ali poudariti čustveni odziv. Efekti so
uporabni tudi za razkrivanje skritega pomena scene. Sodniško kladivce v kombinaciji s
kovanci nam izda, da je pravica naprodaj. Mnogokrat je uporabljena sprememba zvoka
stropnega ventilatorja v helikopterski zvok, kar nas iz sobe ponese na letalno ploščad. Zvoke
pa uporabljamo tudi za vzpostavljanje komičnosti situacij ali za ublažitev zaznave nasilnih
prizorov. Z njimi lahko efektivno ponazorimo dogajanje izven zaslona. Na tak način
izboljšamo ali dopolnimo zgodbo. (Beauchamp, 2005)
Zgodovina posebnih efektov
Uporabo zvočnih efektov v namen dramatizacije lahko zasledimo že v teatrih antične Grčije.
Pomembna stopnja v razvoju je bila radijska igra, ki se je na veliko zanašala na podporo
posebnih efektov z namenom izboljšati slikovitost igre. V zgodnjih letih animacije so se
posebni efekti snemali v studiu, podobno kot poprej v radijske namene. Prav tako so bili
urejevalci slike v začetku animacije tisti, ki so obvladovali snemanje, urejanje in
sinhronizacijo efektov. (Beauchamp, 2005) S časom so posamezniki začeli razvijati celotne
knjižnice posebnih efektov. Posebej je potrebno omeniti kultne arhive družb, kot so Disney,
MGM, Hanna & Barbera in v zadnjem času posebej kreativni Pixar.
6.3.1 Konceptualizacija efektov
V animaciji se srečamo z mnogimi vizualnimi objekti, ki proizvajajo zvoke. Celo neanimirani
predmeti rabijo nekakšno zvočno predstavitev. Tako je pomembno določiti elemente, ki bodo
predstavljeni tudi z zvokom.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 39
Za te predmete se vprašamo: (Beauchamp, 2005)
• Ali je predmet iz naravnih ali umetnih materialov?
• Kako se predmet premika ali medsebojno deluje z okoljem?
• Spada predmet v pripovedno ali ambientalno skupino?
• Ali so za ta predmet na voljo modeli, po katerih lahko dizajniramo zvok?
• Ali naj predmet podpira realizem ali subjektivnost pripovedi?
Pri razvijanju zvočnega efekta je pomembno analizirati predmet ali dogodek, da
identificiramo zvočne komponente, ki pripomorejo k optimalni predstavitvi. Večina
predposnetih efektov pa za popolno zlitje v kontekst potrebuje vsaj nekaj urejanja.
Foley
Slikovit opis oblikovanja zvočnega efekta za osebo, ki se vzpenja po stopnicah, po Foleyu, je
sledeč. Postopno upočasnjevanje posameznega koraka z hkratnim zviševanjem glasnosti
implicira, da se lik zaradi vzpona po stopnicah počasi utruja. Kvaliteta zvoka in glasnost
vsake stopinje prinaša subtilne namige o velikosti, starosti in spolu ter o materialu, iz katerega
so grajene stopnice. Podrobnejše poslušanje nam razkrije dodatne informacije o oblačilu in
morebitnem nakitu. Vsi ti detajli se v naših mislih združijo in tvorijo podrobno sliko scene.
Jack Foley je povzel umetnost uporabe radijskih posebnih efektov in jo apliciral v animacijo.
(Beauchamp, 2005) Tako je razvil posebne efekte, ki so prilagojeni za sinhronizacijo s sliko
in za predstavitev likov. Njegove tehnike so uporabne za ponazarjanje kompleksnih linearnih
dogodkov, kot je hoja. Tudi subtilni elementi, kot so šumenje obleke, dihanje, trepljanje ali
poljubljanje, so kandidati za obravnavo po Foleyevi tehniki. (Peacock, 2001) Tovrstni efekti
se snemajo v studiih, opremljenih s posebnimi snemalnimi prostori, poimenovanimi Foleyevi
boksi. V vsakem od njih so materiali, ki odgovarjajo materialom, ki se pojavljajo na ekranu.
Foley pa se za dodatni realizem snema tudi na terenu, saj se tako artisti lahko dejansko
premikajo, namesto da hodijo na mestu.
Ambient
Mogoče najmanj očiten ali razumljen del posebnih efektov so zvoki ozadja. Le-ti
predstavljajo podlago za govor, efekte in glasbo, podobno kot računalniška grafika nadomešča
zeleni zaslon. Zvoki ozadja so lahko uporabljeni za vzpostavitev realnosti ali fantazije.
(Beauchamp, 2005) Lahko so uporabljeni za glajenje vizualnih prehodov, pripomorejo h
kontinuiteti, prav tako pa definirajo fizične meje. Pogosto se uporabljajo za vzpostavitev tona
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 40
scene. (Peacock, 2001) Ambient je zgrajen iz vrste nesinhroniziranih zvokov. Pri mešanju
ambientalnega zvoka moramo paziti, da ne odvzema zvočnega prostora pomembnim
pripovednim elementom, naprimer govoru. S pozorno kreativno rabo lahko z zvoki ambienta
ustvarjamo spremembe perspektive in dodatno pripomoremo k razvoju lika.
6.3.2 Kreiranje posebnih efektov
Produkcijske hiše razvijajo obširne knjižnice zvočnih efektov z nakupom komercialnih
knjižnic ter zaposlovanjem tehnikov, ki snemajo efekte in tako ustvarjajo privatne knjižnice.
Snemanje se vrši tako v studiu kot na terenu. Nadalje ustvarjalci naredijo originalne zvoke
tudi s pomočjo procesa umetnega kreiranja zvoka, ki mu pravimo sintetizacija. »V pripravo
posebnih efektov, ki jih iz perspektive gledalca dojemamo za samoumevne, je vloženega
veliko dela.« (Forlenza, Stone, 1993, 18) Tako je mogoče ustvariti zadostno knjižnico efektov
tako enostavno in poceni, kot to do dandanes še ni bilo možno.
Komercialne knjižnice posebnih zvočnih efektov
Uporaba zvokov, ki so dosegljivi preko komercialnih knjižnic, je v avdio postprodukciji
postala vsakdanja praksa.
Knjižnice so primerne in poceni, saj vsebujejo zvoke vojaške opreme, nevarnih živali,
zgodovinskih artefaktov in podobno, ki bi jih na drugačen način bilo skoraj nemogoče
pridobiti. Večina profesionalnih knjižnic je organiziranih po tipih zvokov, poleg tega imajo
vgrajen še sistem za iskanje. Vsebino pa nudijo preko CD, DVD, trdih diskov in tudi preko
spleta. Vsi materiali so licencirani za odkup, kar pomeni, da jih po tem, ko jih plačamo, lahko
uporabljamo v poljubne namene brez dodatnega doplačila. (Beauchamp, 2005)
V primeru prenosa brezplačnih materialov s spleta moramo biti previdni, saj je kakovost
velikokrat na takem nivoju, da se njene pomankljivosti odkrijejo šele pri predvajanju na
profesionalnih avdio sistemih, kot jih naprimer najdemo v kinematografih.
Knjižnice posebnih efektov po meri
Za posamezni projekt ustvarjalci mnogokrat proizvedejo knjižnice po meri. Le-te so
sestavljene iz posebej za projekt posnetih efektov in efektov iz že obstoječih baz.
Komercialne knižnice posebnih efektov so resda priročne, vendar pa ima uporaba tudi
določene pomanjkljivosti. To je naprimer kakovost samih vzorcev, ki so pridobljeni iz
mnogoterih virov. Naslednja pomankljivost je ta, da uporaba teh vsesplošno dostopnih
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 41
materialov zapečati končni izdelek z določeno stopnjo generičnosti. Še nadalje lahko novemu
projektu nehote dodamo neželene asociacije na neke druge izdelke, v katerih so bili materiali
uporabljeni. Iz teh razlogov se ustvarjalci mnogokrat odločijo posneti efekte, pisane na kožo
posameznemu projektu. Snemanje se odvija v studiu pod kontroliranimi pogoji ali na terenu.
Snemalec, opremljen z digitalnim snemalnikom, mikrofoni in slušalkami lahko na terenu
zabeleži številne posnetke. (Beauchamp, 2005) Mnogi krasni efekti so pridobljeni po
naključju, kar pa ne pomeni, da v snemanje ni bilo vloženega precej truda. Snemanje na
terenu je časovno potratno, vendar si s tem ustvarjalec skozi leta lahko ustvari pravo knjižnico
posnetkov, ki definira in promovira njegovo kariero. S snemanjem na terenu lahko zajamemo
zvoke v naravnem okolju, ki so takšni, kot jih izkusi lik v svojem okolju na zaslonu.
Urejanje
Večina efektov, neglede na njihov izvor, potrebuje določeno mero urejanja, da se prilagodi
dolžina, ustvari kontrast ali oblikuje nove efekte. Urejanje obsega tudi odstranjevanje
neželenih zvokov v posnetkih. Ustvarjalec uporablja za proces urejanja mnogo orodij, kot so
orodje za prelive, filter šumov, izenačevalniki in obrezovalniki. Postopki so podobni tistim iz
poglavja o glasbi. Eden kreativnejših pristopov pri urejanju posebnih efektov je gradnja novih
efektov z nalaganjem dodatnih zvokov (angl. sweetening). Večina poslušalcev ni zmožna
slišati posameznih zvokov znotraj tako ustvarjenega efekta. Pogosto se določen zvok uporabi
ob več priložnostih, zato je pri tem treba imeti v mislih tako variacije kot kontinuiteto. To
izrazito velja še posebej za Foleyeve efekte. Variacije se lahko dosežejo skozi spremembe
volumna, hitrosti, časovnega raztezanja, ritmične manipulacije in kompozicije. (Yewdall,
1999)
Procesiranje signala
Z izjemo ambienta je večina zvokov posnetih tako, da ne vsebujejo neželenih komponent.
Taki zvoki se dokaj enostavno obdelajo med procesom mešanja zvoka, da sodijo v kontekst
celotnega izdelka. Kljub temu pa mnogo zvokov zahteva dodatno procesiranje signala z
namenom popravljanja, oblikovanja zvoka in izboljšanja prostorskosti. Redukcija šuma je
neizbežna za posnetke, zajete v nekontroliranem okolju, torej na terenu. V nasprotju z
urejanjem, kjer je signal v celoti izrezan, gre tukaj za postopek, pri katerem se odstrani signal
okoli in v želenem območju, hkrati pa se večina originalnega zvoka ohrani. Oblikovanje
zvoka (angl. sound shaping) je proces, ki vključuje namerno manipulacijo signala za dosego
specifičnih učinkov. Sprememba višine tona (angl. pitch shifting) se uporablja za namen
variacije in je lahko velika nekaj poltonov, preden doseže neželene učinke, ki pa s
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 42
pretiravanjem lahko pripeljejo do čisto novega zvoka, kar je včasih pozitivno. Predvajanje
nazaj (angl. reverse) se velikokrat uporablja nad zvoki komprimiranja zraka, da se doseže
efekt odpiranja vrat ali vzletanja letala. Reverb je najpogosteje uporabljen za ponazarjanje
prostorskih lastnosti. Reverb nad vsemi tremi zvočnimi vrstami pripomore k enotnemu
občutku znotraj posamezne scene. Uporablja se tudi za kontrast, v sedanjem času je efekt brez
odmeva, v preteklem pa z veliko odmeva. Efekti iz knjižnic z dodanim reverbom so
problematični, kar se tiče ujemanja s perspektivo. Zato je to potrebno upoštevati ob snemanju
na terenu. Dopplerjev efekt je orodje za pretiravanje v prikazovanju perspektive. Je pa tudi
učinkovit način za vzpostavljanje zornega kota, realizma in energije gibanja. (Beauchamp,
2005)
Sinhronizacija
Zvočni efekti morajo soobstojati z dialogom in glasbo, zato so pozicionirani kontekstualno
namesto dosledno glede na sliko. V nekaterih primerih je efekt bolje umestiti pred ali za
ustreznim dogodkom z namenom preprečiti maskiranje glasbe ali govora. Zakasnitev zvoka je
pogosto uporabljena tudi za to, da ima občinstvo čas dojeti sliko in nato še zvok. Trda
sinhronizacija (angl. hard sync), kar pomeni postavitev zvoka znotraj enega ali dveh okvirjev
glede na sliko, je postala že nekakšna avdio vizualna konvencija, ki se ne ozira na razdaljo, ki
je implementirana v prizoru. Dokončno pozicioniranje vsakega zvoka je rezervirano za
zaključno fazo mešanja zvoka, kjer tudi glasba in govor prispevata v kontekst za
pozicioniranje. Zvoki na zaslonu, ki so mirujoči, so pozicionirani statično, premikajoči se pa
so pozicionirani dinamično. Sinhronizirani zvoki, statični in dinamični, so pozicionirani na
svojo pozicijo. Zvoki izven zaslona pa so pozicionirani tako, da implicirajo svojo pozicijo. To
pogosto vključuje tudi uporabo kanalov surround, če so le-ti na voljo. Posebni efekti so včasih
vzpostavljeni izven prikazovalnika, preden se pojavijo na njem. V kompleksnih vizualizacijah
so vsi razen ključnih zvokov nesinhronizirani. (Beauchamp, 2005)
6.4 Osnove oblikovanja zvoka
Uspeh, ki ga je Walt Disney požel z animiranim filmom Steam boat Willie (1928), ga je
vzpodbudil, da je zvok sinhroniziral tudi k animacijam Plane Crazy (1929) in The Gallopin'
Gaucho (1928), ki sta že pred tem bila izdana kot nema filma. Ta hitra preureditev se je
izkazala za veliko kompleksnejšo zadevo, kot je Disney predvideval. Tako je ugotovil, da je
povezava med zvokom in sliko veliko bolj sinergična, kot si je predstavljal. Narativna
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 43
animacija je najbolj efektivna v primeru, ko slika in zvok popolnoma sodelujeta v
pripovedovanju zgodbe. »Čeprav je bil, zgodovinsko gledano, zvok velikokrat zapostavljen
glede na sliko, pa mu mnogi izkušeni animatorji pripisujejo tudi do 70 % prispevka k uspehu
celotnega projekta. Verjamejo, da se uspešen soundtrack pogosteje čuti, kot sliši. Ugotovili so
tudi, da občinstvo zazna slabo pripravljen zvok, čeprav ne more točno določiti, kaj je narobe.
Psihologi vedno povezujejo avdio in vizualni del naših vsakodnevnih izkušenj. Pravijo, da si
ljudje zgodbo predstavljajo, ko poslušajo radijsko igro, in da si ustvarjajo zvočno sliko, ko
berejo.« (Beauchamp, 2005, 17) Če torej želimo občinstvo voditi skozi pripoved, moramo
dobro razumeti povezavo zvoka in slike.
Klasifikacija zvoka
Zvok lahko slišijo liki v animaciji in občinstvo ali samo občinstvo. Ko vidimo izvor zvoka, je
le-ta poimenovan kot zvok na prikazovalniku (angl. on-screen), v nasprotnem primeru pa kot
zvok izven prikazovalnika (angl. off-screen). Posebej zanimivo je, da je lahko zvok izven
prikazovalnika in ga poleg občinstva slišijo tudi liki. Zvok izven prikazovalnika vzpodbuja
gledalca k vizualizaciji. Fraza 'stradaj oko in hrani uho' je osnova za zvok izven
prikazovalnika. Zvočni efekti, ki so povezani z objekti na zaslonu, se imenujejo trdi efekti.
Michael Chion (1994) je opredelil zvoke v tri kategorije: vsakdanji (angl. casual), semantični
(angl. semantic) in reducirani (angl. reduced). S tem je vzpostavil teoretično ogrodje za
delitev zvočnih efektov. Vsakdanji ali dobesedni efekti so ti, ki delujejo kot akcija in reakcija
– kar vidimo, tudi slišimo. Pomembni so za poudarjanje realizma. Pri semantičnem zvoku je
pomen važnejši od samega zvoka. Naprimer pomen informacij, poslanih s pomočjo
Morsejeve abecede, je pomembnejši kakor piskanje, ki je dejanska abeceda. Reducirani zvok
je tisti, ki je popolnoma osvobojen svojega izvora, to so razni vzorci – sampli, ki se pri
kreiranju združujejo v kompleksne zvočne strukture. Kreativni zvočni dizajn je v glavnem
produkt reduciranih zvokov.
Razlike v vizualnem in zvočnem dojemanju
»Slika je primarna, tukaj ni dvoma. Smo vizualno orientirana družba in smo prisiljeni gledati
slike na način, ki je drugačen od načina, kako poslušamo zvoke.« (Forlenza, Stone, 1993, II)
Na področju fotografije obstaja rek, da je slika vredna tisoč besed. Na področju radia,
natančneje radijske igre, obstaja rek, da je zvok vreden milijon slik. Animacija pa izkorišča
sliko in zvok ter s tem postaja umetnost, ki je večja kot seštevek obojega. Vseeno pa se v
dojemanju vizualnega in zvočnega pojavljajo precejšnje razlike. Občinstvo hitreje dojema,
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 44
pripiše pomen in si zapomni zvočne informacije kot slikovne. Kompleksne vizualne scene od
gledalca zahtevajo večkratno ponovitev, preden si izoblikuje dokončno sliko, medtem ko se
za kompleksne zvoke to zgodi mnogo prej. Pri zdužitvi obojega zvok pomaga gledalcu
dojemati celotno dogajanje. (Beauchamp, 2005)
Zvok nas vodi od enega vidika do drugega, nam pojasnjuje dogajanje in povečuje čustvene
odzive. Vizualno kompleksne scene so potrebne za dosego dramatičnosti, vseeno pa v
določenem trenutku želimo, da se gledalec osredotoči le na specifičen detajl znotraj te scene.
(Peacock, 2001) Le-to pa lahko dosežemo z dobro izvedenim zvočnim dizajnom. Naše vidno
polje je v grobem omejeno na 180°, zato je v animaciji potrebno narediti vizualne reze in
premike, da lahko obzorje razširimo čez to mejo. Zvok pa zaznavamo na vseh 360°, kar
ponazarja dogajanje na ali izven zaslona. Kot že omenjeno, nam zvok lahko pomaga pri
razumevanju kompleksnih slikovnih kompozicij, po drugi strani pa z zvokom dodamo
kompleksnost enostavnim slikovnim elementom.
Vpliv zvoka na zaznavo časa
Z enostavnim poizkusom lahko hitro ugotovimo, kako zvok vpliva na čas ob gledanju filma.
Predvajajmo si sceno policijskega pregona, vendar izklopimo zvok. Opazimo, da so mnogi
posnetki precej statični. Bližnji posnetki drvečih avtomobilov ali likov nam še dodatno
odvzemajo občutek gibanja. Rezi imajo vsak svojo hitrost. Sedaj isto sceno poglejmo še
enkrat, vendar tokrat dodajmo linearni zvok, naprimer glasbo. Takoj zaznamo, da se v
celotnem dogajanju pojavita neka tenzija in kontinuiteta. Tudi rezi dobijo svojo soslednost.
Retrospekcije, ponovitve, predvajanje nazaj in hitri posnetki so časovni koncepti, ki zahtevajo
pozorno ravnanje. Njihovi zvočni učinki so prehodi, hitri posnetki in predvajanje nazaj. Le ti
pomagajo vzpostaviti opisane časovne koncepte. Tudi počasne posnetke lahko z dobrim
zvočnim dizajnom učinkovito poudarimo. Velikokrat se za to uporablja upočasnitev glasbe ali
ritmičnih efektov, včasih pa tudi odbiti zvok nizke jakosti. Kontrasti v ambientu in glasbi ter
efekti med scenami lahko tudi uspešno opišejo potovanje skozi čas.
Dober film je lahko dolg več ur, pa se bo vseeno zdel kratek. Slab film je lahko kratek, pa se
bo vseeno vlekel celo večnost. »Kritiki, ki govorijo o dolžini, dejansko govorijo o kakovosti.«
(Beauchamp, 2005, 19) Tukaj pa ima zvok vsekakor velik pomen, saj smo že ugotovili, da
lahko gledalca motivira in od njega pridobi več pozornosti, kar posledično vpliva tudi na
subjektivni vtis o dolžini celotnega filma.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 45
Vpliv zvoka na zaznavo prostora
Ko se je pojavil prostorski zvok, je le-ta razširil kinematografsko pripoved izven platna. Z
efektivno rabo lahko zvok vzpostavi prostorske koncepte globine, širine in višine. To
dosežemo s procesiranjem signala, pozicioniranjem, in ustreznim mešanjem zvoka.
Procesiranje signala, naprimer reverb, oblikuje predstavo prostora. Izenačevanje in
manipulacija frekvenc igrata pomembno vlogo v predstavi globine. Znano je, da nizke
frekvence potujejo dlje, zato je potrebno z oddaljevanjem posnetka (angl. zoom out),
zmanjšati visoke frekvence. Tudi s samo glasnostjo poudarjamo globino – bližje smo izvoru
zvoka, bolj ga moramo slišati, zato v primeru približevanja posnetka (angl. zoom in)
povečujemo glasnost. Tudi sprememba višine tona je postala že sama po sebi uporabna za
poudarjanje gibanja naprej nazaj, čeprav ne bazira na realnosti. Pozicioniranje je uporabno za
predstavo širine prostora in v primeru dinamičnega pozicioniranja tudi premikov po prostoru.
Bolj so zvoki v centru, ožje je polje in obratno. Znano je tudi, da nizke frekvence potujejo
navzgor po našem telesu skozi stopala. Iz tega razloga ojačamo nizke frekvence in dodamo
nizkofrekvenčne efekte, ko se slika spušča ter ravno obratno, ko se dviga. Višino lahko
dodatno poudarjamo tudi z glasbeno podlago, katere melodija se skupaj s sliko viša ali niža.
»Vse naštete elemente lahko združimo in s tem razširimo prostorsko izkušnjo animacije.«
(Beauchamp, 2005, 20)
Vpeljevanje občinstva v pripoved
Animacija se začne s 30 sekundami črnine. V tem času zaslišimo naraščajočo renesančno
glasbo, kočije, ki se premikajo po blatnih ulicah in zvok ambientalnega pogovora s tu in tam
izstopajočimi posameznimi besedami. Vse to že definira klasični prizor iz 15. stoletja nekje v
Angliji. Kljub pomanjkanju slike je občinstvo že vzpostavilo vizualni vtis in pričakovanje
omenjene scene. V tem primeru zvok deluje kot hipnotizerjevo nihalo, ki povede gledalca iz
resničnega sveta v pripoved, ki se bo odvijala na zaslonu. Opisan primer je vzpostavitev
zvoka z dodano ekonomično vrednostjo, saj je zvok reduciral potrebo po animiranju
opisanega dogajanja. Z razvojem dogodkov zvok nadalje zaključi trenutno ali pa gledalca
povede v naslednjo sceno. Na koncu filma je spet uporabljena glasba z namenom napovedati
konec in pripeljati gledalca nazaj v realnost, prav tako kot to stori hipnotizer s štetjem od
deset proti ena.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 46
Verodostojnost in realnost
Z animacijo lahko lepo poustvarimo realni svet, daje pa nam tudi možnost da osvobodimo
domišljijo in s tem poustvarimo še ne videne prizore. »Velikokrat se pa zgodi, da se realnost
na nek način podaljša z domišljijo. Tako dobi animacija neko svojo verodostojnost, katera
bolj nazorno prikaže same dogodke.« (Beauchamp, 2005, 20) Tak primer je padanje dežnih
kapljic v animiranem filmu A Bug's Life (1998), ki je pretirano poudarjeno z uporabo zvoka
raket in bombnih eksplozij. To nas uspešno ponese v povsem novo realnost mravljice, ki je
zanjo povsem verodostojna. Za take primere se dostikrat uporablja tudi tako imenovani
metaforični zvok. Naprimer padec kojota v kanjon bi dejansko izzval zvoke, kot so lomljenje
kosti, udarjanje kosa mesa ob ploščo za ponazoritev sil na organsko tkivo, stiskanje sadja, ki
ponazarja špricanje krvi ter mečkanje notranjih organov, in podobno. Vendar je v sklopu
risanega filma čisto dovolj igriv kartonski udarec, ki verodostojno poudari ali v tem primeru
olajša izpostavljen dogodek.
Blaženje prehodov in ustvarjanje kontinuitete
Naše vsakdanje življenje se z izjemo sanj odvija zaporedno – linearno. Kinematografska
izkušnja pa je po navadi nelinearna, saj se z različnimi rezi in ritmom pojavljajo scene, ki
opisujejo trenutno stanje, spomine iz preteklosti, istočasne dogodke in tako naprej. Zvok
pogosto poskrbi za dodajanje soslednosti vsemu temu nelinearnemu napredovanju slike.
Samoumevno bi bilo, da se govor in ostali efekti zaključijo ob rezu, vendar se nadaljujejo do
svojega lastnega zaključka, saj le na ta način lahko uspešno podajo svojo informacijo, hkrati
pa poskrbijo za kontinuiteto dogajanja. Zvok, ki ga sliši samo občinstvo, kot sta
pripovedovanje ali glasbena podlaga, je načeloma linearen, ni odvisen od rezov ter ponavadi
spremlja celotno sceno. To prispeva k blaženju prehodov in poskrbi za zaporedno odvijanje
dogodkov. (Peacock, 2001)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 47
7 PROCES PRODUKCIJE
Računalniška animacija zelo vpliva na produkcijsko proceduro, saj večina 2D in 3D animacij
pride do ustvarjalca zvoka v digitalnem formatu. Tako ima digitalni video globoke implikacije
za avdio komponento animacije. O začetku razvoja soundtracka lahko govorimo že v sami
preprodukciji. V naslednjih poglavjih si bomo ogledali pomembne vidike v produkciji
animacije s stališča razvoja soundtracka. Digitalna doba je omogočila animatorjem, da lahko
izpeljejo svoje projekte brez sredstev ali vpliva velikih studiev. S to svobodo pride tudi izziv
ustvariti produkcijski model, ki karseda dobro izpolnjuje vizijo za vsak projekt.
Celotna produkcijska pot je razdeljena v tri faze:
• preprodukcija,
• produkcija in
• postprodukcija.
7.1 Preprodukcija
Razvoj koncepta
Razvoj koncepta vsebuje scenarij, povzetek in konceptno risbo. Scenarij in povzetek sta
pogosto prvi stik ustvarjalca zvoka s projektom. Scenarij vsebuje mnogo namigov za
ustvarjanje zvoka, saj scenaristi velikokrat poudarijo predlagane zvoke v samem scenariju.
Snemalna knjiga
Snemalna knjiga je zaporedje risb, ki vizualizirajo zgodbo. Risbe so mnogokrat črnobele z
omejenimi detajli ozadja. Uporabne so za predlaganje gibanj, identificiranje produkcijskih
potreb in brainstorming. (Wellins, 2006) Skrbno izdelana snemalna knjiga služi kot nekakšen
načrt za celotno produkcijo.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 48
Sinhronizacijski avdio material
Govor in glasba sta pogosto posneta že pred začetkom animacije in služita za sinhronizacijo.
Sinhronizacijski zvok pogosto razkrije napake v ciklični animaciji, kot so hoja ali
pospeševanje. Ves sinhronizacijski material mora biti določen pred samim postopkom
animacije. (Beauchamp, 2005)
Animatik
Animatik je neke vrste video snemalna knjiga z omejeno animacijo, možnimi koti kamere in
določenim časovnim ujemanjem. Osnova so skenirane sličice iz snemalne knjige. Ko je
animacija shranjena v video format, se izdela avdio z vključenim govorom, posebnimi efekti
in začasno glasbo, ki služi za časovno usklajevanje. (Wellins, 2006) Izdelek služi kot načrt za
animacijo, ki usmerja veliko odločitev, katere bi v primeru igranega filma bile odložene vse
do postprodukcije.
Določitev formata izdaje
Format naj bi bil določen v fazi preprodukcije. Odločitev pa vpliva na število avdio kanalov,
frekvenčni odziv in dinamični razpon, dosegljiv na izbranem formatu. (Holman, 2008)
Obvladovanje sinhronizacije
Sinhronizacija je pomemben aspekt pri produkciji animacije, vendar velikokrat ustvarja
zmedo. Časovna koda SMPTE na sliki 7.1 je standard za merjenje časa.
Slika 7.1: Časovna koda SMPTE
»V idealnih pogojih bi se odvijali animiranje ter urejanje in razvoj soundtracka na istem
številu okvirjev v časovnem intervalu, kot je predviden za izbran format. To pa se le malokdaj
zgodi.« (Beauchamp, 2005) Animatorji 2D animacij delajo na 24 okvirjih v sekundi, 3D
animatorji pa na 30 okvirjih v sekundi. Če bo izbrani format film, bo število okvirjev 24, če
bo video za format DVD ali NTSC bo število okvirjev 29,97 ali v primeru PAL 25 okvirjev
na sekundo. Za predvajanje zvoka ob filmu ali pa ob videu morata biti ustvarjena ločena
zvočna zapisa.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 49
Obvladovanje projekta
Preprodukcijska faza zahteva sinhronizacijo ustnic za govor in pripovedovanje, prvotne
melodije in začasno glasbo ter posebne efekte. Ti elementi so kombinirani in urejeni v končni
animatik projekt. Praksa je, da pustimo te vrste zvoka ločene vse do zaključne faze mešanja
zvokov. S tem dosežemo, da je projekt izpeljan čimbolj učinkovito. Vsi kanali naj bodo
diskretno poimenovani, kar je pomembno za navigacijo znotraj projekta in za iskanje
izgubljenih datotek. (Beauchamp, 2005)
7.2 Produkcija
S tem, ko se animacija razvija, je na voljo vedno več vizualnih podrobnosti, s katerimi si
lahko ustvarjalec zvoka pomaga pri svojem delu.
7.2.1 Produkcijski časovni plan za računalniško animacijo
1. Modeliranje (angl. modelling) je proces določanja grobih karakteristik likov in predmetov v animaciji. Iz tega lahko pridobimo informacije o velikosti, vrsti in spolu ter tako konceptualiziramo, kakšen zvok bo objekt proizvajal.
2. Določitev gibalnega prostora (angl. rigging) vključuje, kje in kako se model lahko premika.
3. Animiranje (angl. animation) je proces, pri katerem se objektom animacije pripiše želeno gibanje. Na tej točki se animirajo ustnice in ponavljajoči se gibi. Test gibanja z vsebujočim začasnim zvočnim zapisom lahko razkrije napake v ponavljajočem se animiranem gibanju, kot je recimo hoja, ki mogoče niso na hitro opazne.
4. Ustvarjanje dinamičnih procesov (angl. dynamics) je faza, v kateri so ustvarjeni kompleksni vizualni učinki, kot so izpušni plini reaktivnih motorjev, dim, megla ter oblaki.
5. Osvetlitev (angl. lightning) izpopolni okolje, poudari ali zakrije določene podrobnosti in pomaga ustvariti razpoloženje.
6. Kompozicija (angl. compositing) je postopek združevanja več plasti, ustvarjenih z računalniško animacijo.
7. Upodabljanje (angl. rendering) je proces zlivanja vseh računalniško animiranih elementov za ustvarjanje posameznih okvirjev.
Razvijajoči se odtis dela
Animatik je najosnovnejši odtis dela, sestoječ iz negibnih slik iz snemalne knjige. Te slike so
postopoma zamenjane z grobimi animacijami in prvotnimi postavitvami kamere. Tako
nastane predvizualizacijski odtis dela. Doda se tudi naslovna sekvenca, da se video pripravi za
zaklepanje slike. To začasno delo se lahko uporabi za demonstracijo zvoka. Ko se vsa
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 50
animacija in postavitve kamere zaključijo ter so časovne uskladitve določene, se proizvede
začasni odtis dela. Zaključna faza animacijskega postopka vključuje kompozicijo, osvetlitev,
posebne efekte, upodabljanje in zaključne napise. Ko se ti elementi dodajo, nastane končni
odtis dela in začne se postprodukcijska faza. Na začetku končnega odtisa dela se nahaja
odštevalna sekvenca s sinhronizacijskim signalom (angl. sync-pop), ki služi za sinhronizacijo
zvoka. (Beauchamp, 2005) Le-ta se, kot prikazuje slika 7.2, nahaja na drugem okvirju pred
dejanskim začetkom animacije. Predpisano je, naj ima ta zvok frekvenco 1 kHz na -20 dB in
traja en okvir. Podoben zvok se lahko doda tudi na koncu animacije.
Slika 7.2: Sinhronizacijski signal (Beauchamp, 2005)
Velikokrat se doda tudi vključeno okno s časovno kodo, ki zagotavlja vizualno referenco za
sinhronizacijo za sisteme, ki ne podpirajo kode SMPTE. Uporablja se tudi v kombinacji z
dejanskim zaslonom SMTPE za dodatno kontrolo. Odtis dela naj zagotavlja zadostno
resolucijo, obenem pa naj ne monopolizira območja za avdio produkcijo. Če je za predvajanje
animacije namenjen dodatni monitor, je lahko ločljivost večja. Ločljivost in format, ki je
kompatibilen z avdio aplikacijo, določi ustvarjalec zvoka. Odtis dela naj v glavnem vsebuje
vse pomembne informacije, vključno s številom okvirjev na sekundo in uporabljenim
kodekom.
7.2.2 Naloge oblikovalca zvoka v fazi produkcije animacije
V tej fazi je lahko narejenega veliko dela. Predhodno delo podpira kreativnost in povečuje
produkcijski čas. Vseeno pa moramo vedeti, da je ves nesinhroniziran zvok na tem mestu še
vedno predmet odobritve. Večina dela v tej fazi je logično nadaljevanje nalog iz
preprodukcije.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 51
Avdio raziskava
Pomembno je, da ustvarjalec zvoka dobi priložnost raziskati sorodne projekte in obstoječe
modele ter preštudirati sorodne realne – fizične situacije, kakor to delajo ustvarjalci grafične
animacije. Tako dobi občutek, kaj in na kakšen način delajo drugi in kako je občinstvo to
sprejelo. To lahko precej pomaga h končnemu izdelku.
Priprava posebnih efektov
Čas produkcije je idealen za gradnjo zbirke posebnih efektov po meri projekta. To vključuje
snemanje na terenu in nabavo efektov iz komercialnih knjižnic. Pri zbiranju efektov si lahko
veliko pomagamo z animatikom.
Premislek o glasbeni podlagi
Skladatelj lahko ta čas izkoristi za oris potencialnega glasbenega materiala. Teme ali melodije
so pogosto najtežji del in so lahko razvite brez slike in pozneje prilagojene za sinronizacijo.
Ustvari lahko tudi sinhronizirane iztočnice na podlagi začasnega odtisa dela. V tem času je
možno najti tudi intervale za nesinhronizirano glasbo. (Beauchamp, 2005)
Začasni avdio
Na raznih stopnjah razvoja se tudi začasna glasba in posebni efekti dodajo k odtisu dela.
Začasni avdio posnetki služijo več namenom, eden od njih je predlaganje vrste glasbe.
»Rutinsko se uporabljajo za pripravo dela v nastajanju namenjenega predvajanju pred testnimi
občinstvi. Začasni avdio lahko služi tudi kot diagnostično orodje za proces animiranja.«
(Beauchamp, 2005, 142) Predhodno ustvarjeni zvok lahko pomeni dodatno povratno
informacijo za usmerjanje časovnega aspekta animiranja. Enak pristop je uporaben tudi za
končno urejanje slike.
Grajeni zvočni efekti
V tej fazi se lahko začneta tudi izdelava in eksperimentiranje z zvočnimi efekti, ki so grajeni
iz več različnih zvokov, saj v tem času mnogi izmed likov oživijo in s tem postanejo primerni
za začetek zvočnega tretmaja. (Wellins, 2006)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 52
7.3 Postprodukcija
Dostava končnega odtisa dela ali videa pomeni začetek avdio postprodukcije.
Razvoj elementov soundtracka
Kontrolna seja (angl. spotting session) pomeni za producenta zadnjo priliko, da definira in
specificira potrebe za soundtrack. Tradicionalno se odvijajo kontrolne seje za posebne efekte
in glasbeno podlago ločeno. Vseeno pa skupna seja omogoča bolj integriran pogled na projekt
za ustvarjalca zvoka in skladatelja. Po zakjučku teh sej se ustvarijo zapiski, ki služijo kot načrt
za usmerjanje preostale avdio postprodukcije. Vsebujejo pozicioniranje elementov in oris
kanalov, ki pridejo v poštev pri samem mešanju zvoka. Na tej točki ustvarjalec zvoka zgradi,
uredi in sinhronizira elemente za sfero posebnih efektov. Skladatelj razvije in producira
glasbo s pomočjo glasbenikov ali elektronskih naprav ali kombinacije obojega. V nekaterih
primerih se zamenja tudi govor, kar pomeni dodatno priložnost za darovalce glasu, ki lahko
svoj nastop še izboljšajo v dejanskem kontekstu animacije. (Beauchamp, 2005)
Vmesna faza mešanja zvoka
Ko se postprodukcijska faza bliža koncu, se elementi mešajo v vmesne zvočne zapise (angl.
premixes). Le-ti so razviti posebej za vse tri v prejšnjem poglavju opisane vrste zvoka.
(Yewdall, 1999) Oblikovani so tako, da pripomorejo k organizaciji, zmanjšajo število kanalov
in poenostavijo zaključno fazo mešanja zvoka, tako da izpostavijo elemente, ki naj bi
zahtevali posebno obravnavo ali bi lahko povzročali teževe. Zvočni efekti so združeni v
vmesne zvočne zapise, od katerih vključuje vsak po osem kanalov, na način, po katerem
zagotavljajo najvišjo predvideno organizacijo, ki je unikatna za vsak projekt. Tipični vmesni
zvočni zapisi za efekte vključujejo grupirane trde efekte, oblikovane efekte, Foleyeve efekte
in ambient. Vmesni zvočni zapisi za glasbo so ustvarjeni tako, da ločijo orkestralne,
sintetizirane, ritmične, harmonične, melodične, solo in bas elemente. Govor pa se pripravi
ločeno za vsak lik. (Beauchamp, 2005) Odločitev za pozicioniranje, jakost, in procesiranje
signala se na tem mestu sprejme samo za elemete, ki so dokončni.
Zaključna faza mešanja zvoka
Ko so vmesni zvočni zapisi končani, nastopi tenutek, ko so prvič združeni in predvajani v
zaključni fazi mešanja zvoka (angl. final mix ali recording). Na tej stopnji se v polnem
kontekstu predvajanega zvoka in slike sprejme dokončna odločitev o pozicioniranju, jakostih
in procesiranju signala za določene objekte. V posameznih primerih se, kot posledica
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 53
vzpostavitve prioritet za zaključno fazo mešanja zvoka, iz vmesnih zvočnih zapisov odstrani
določene elemente. Ko so vse odločitve sprejete, se vsaka od vrst zvoka meša posebej, da se
ustvarijo trije individualni 6-kanalni zvočni zapisi. (Beauchamp, 2005) Nato se za vsakega od
njih naredita še globalno izenačevanje in kompresija, da izdelek ustreza tehničnim zahtevam
za izbrani format. Temu pravimo tudi mastering. Po odobritvi izdelka se ustvarijo 5.1, stereo
ali mono zvočni zapisi, ki so v formatu izdaje združeni s končno animacijo.
7.3.1 Pozicioniranje v večkanalnem zvočnem zapisu
Pozicioniranje je v filmu enakovredno postavitvi igralcev v gledališču. Lahko je statično, ko
zvok izhaja iz točno določenega mesta, ali dinamično, kadar zvok izhaja iz premikajočega se
objekta. Fiksno ali statično pozicioniranje podpira stabilnost v zvočnem zapisu in statične ter
ambientalne predmete. Dinamično pozicioniranje pa se uporablja za vzdrževanje perspektive s
predmeti, ki se premikajo na zaslonu. (Yewdall, 2001)
Pozicioniranje govora v sistemu 5.1
Govor nosi drugačno informacijo kot posebni efekti in glasba. Teoretiki so odkrili, da se
občinstvo bolj koncentrira na vsebino in ne toliko na pozicijo in jakost govora. To deloma
razloži tudi dejstvo, zakaj je govor pozicioniran v center in so jakosti bolj kot ne enakomerne,
neglede na postavitev kamere (slika 7.6A). V nekaterih situacijah pa je seveda drugačno
pozicioniranje na mestu.
Levi in desni kanal sta pogosto uporabljena za pripovedovanje, kar ustvarja dodaten kontrast
med nesinhroniziranim in sinhroniziranim govorom (slika 7.6B). Zvok množice v ozadju je
obravnavan kot element ambienta in je zato pozicionirana na kanala za surround. Govor je
pogosto vključen še v levi in desni kanal, kar omogoči dodatno kritje v velikih kinematografih
(slika 7.6C). Perspektiva in pozicioniranje izven zaslona se uporabljata, kadar je
pozicioniranje bistvenega pomena za pripoved (slika 7.6D). Ekstremni primer dinamičnega
pozicioniranja govora je let zvoka preko vseh zvočnikov, najdemo ga naprimer v animiranem
filmu Casper (1995) (slika 7.6E). Le redko, v primerih, ko je govor zelo modificiran v
dramatične namene, pa se del govora uporablja v kanalu LFE. (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 54
Slika 7.6: Pozicioniranje govora v sistemu 5.1 (Beauchamp, 2005)
Pozicioniranje glasbe v sistemu 5.1
V večkanalnih formatih glasba za naslove uporablja vse kanale, ki so na voljo za maksimalno
kritje in poudarek (slika 7.9A). Ko se začne pripoved, se pozicioniranje reducira na levi in
desni kanal. Tudi glasbena podlaga ali poudarki so pozicionirani enako (slika 7.9B). Glasba,
ki ima določen izvor na zaslonu, naprimer radijski sprejemnik, je pozicionirana v center (slika
7.9C). (Beauchamp, 2005)
Slika 7.9: Pozicioniranje glasbe v sistemu 5.1 (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 55
Pozicioniranje posebnih efektov v sistemu 5.1
Tipično so posebni efekti pozicionirani tako, da odražajo objekte na zaslonu ali orisujejo
gibanje izven zaslona (slika 7.7A in B). Dodajanje centra pa pomaga zgladiti prehod
dinamično pozicioniranega efekta, ko se giblje iz ene na drugo stran po sprednjih zvočnikih
(slika 7.7C). V nekaterih primerih so efekti dimamično pozicionirani tako, da potujejo preko
vseh petih zvočnikov (slika 7.7D). (Beauchamp, 2005) Nasprotno od dialoga in glasbe za
podlago se efekti pozicionirajo dinamično, da sledijo objektom, katerih zvok predstavljajo.
Ob tem izboljšajo dojemanje gibanja in prostorske perspektive, ki se odvija na zaslonu.
Pogosto so uporabljeni tudi kot orodje za prehode.
Slika 7.7: Pozicioniranje posebnih efektov v sistemu 5.1 (Beauchamp, 2005)
Pozicioniranje ambienta v sistemu 5.1
Ambient je rutinsko pozicioniran na vse ali katerikoli prosti kanal. Ko je ambient pozicioniran
na sprednje kanale, občinstvo to dojema, kot da so zunanji opazovalci (slika 7.8A). Ko pa je
ambient pozicioniran na sprednje in surround kanale, pa se občinstvu zdi, da je postavljeno v
samo dogajanje (slika 7.8C in D). Vsakodnevna praksa je tudi postavitev različnih
ambientalnih zvokov na različne kanale (slika 7.8B). (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 56
Slika 7.8: Pozicioniranje ambienta v sistemu 5.1 (Beauchamp, 2005)
7.3.2 Operacije v zaključni fazi mešanja zvoka
Procesiranje signala se v veliki meri zgodi prav v zaključni fazi mešanja zvoka, kar
ustvarjalcu omogoča fleksibilnost pri ustvarjanju kontinuitete in perspektive. Reverb je primer
takega procesiranja. Kontinuiteta znotraj scene se poustvarja z dodajanjem enakega reverba
na vse kanale, vendar pazimo, saj se s povečevanjem reverba razumljivost zmanjšuje. Zaradi
tega razloga je govor deležen manj reverba kot ostali zvočni elementi.
Nastavitev jakosti predstavlja najmočnejše orodje za prioriteto posameznega elementa v
zaključni fazi mešanja zvoka. Višja jakost postavi predmet v ospredje, nižja pa v ozadje, kar
orisuje nekakšno globino zvočnega polja. Prav tako z višanjem jakosti objekt zavzame več
prostora v samem zvočnem zapisu. Zato pravilno uravnovešanje vsakega objekta zahteva
večkratne ponovitve nastavitev jakosti. Inžinerji prav tako spremljajo ravni posameznih
kanalov, da se izognejo popačenju zaradi preobremenitve signala, ki se lahko zgodi, ko je več
kanalov združenih. (Holman, 2008) Zvoki z velikim dinamičnim razponom predstavljajo
največji izziv za uravnoteženje jakosti. Kompresija je pogosto uporabljena v zaključni fazi, da
se kontrolira in optimizira izhodne ravni, s čimer vsak objekt postane bolj predvidljiv in
prijaznejši za mešanje zvoka.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 57
Mastering je verjetno namanj razumljen proces v avdio postprodukciji, vsekakor pa je
kritičnega pomena za uspeh soundtracka. Avdio mastering bi lahko enačili s korekturo barv v
animaciji. Medtem ko je mešanje zvoka lokalno, kanal za kanalom, je mastering globalen in
obsega izenačevanje, kompresijo in dodajanje naključnega šuma za zmanjšanje
kvantizacijskih napak, da optimira zvočni zapis za format izdaje. Zvočni zapis, v katerem
izstopa določeno frekvenčno območje, na nek način utruja občinstvo. Z izenačevanjem želimo
ustvariti spektralno uravnovešeno sliko. Ko so določeni globalno, izenačevalniki ustvarjajo
zvočni rezultat, ki je primerljiv z različnimi filtri na kameri ali z osvetlitvijo. Če je zvok
umazan, lahko porežemo frekvence med 100 in 300 Hz, ki povzročajo nerazločnost zvoka. Če
pa je zvok oster, si pomagamo tako, da rahlo porežemo frekvence med 1 in 3 kHz in z
občutkom ojačamo frekvence nad 12 kHz za dodatno izbistritev. Če je potrebno preveč
izenačevanja, je priporočljivo ponovno urediti vmesne zvočne zapise, da ukrotimo morebitne
problematične zvoke. Vsak format omogoča določen dinamični razpon. Za formate, ki so v
spodnji meji, je obvezna kompresija, ki zagotovi, da dinamični razpon odgovarja formatu.
Uporaben je tudi omejevalnik (angl. limiter), ki prepreči, da bi nivoji presegli sprejemljive
vrednosti, kar se pogosto zgodi, ko združujemo več kanalov. Če je bilo mešanje zvoka
narejeno korektno, bo omejevanje skorajda ničelno. V primeru, da je potrebno prekomerno
omejevanje, pa je vredno še enkrat urediti zvočni zapis. Na zadnji stopnji dodamo že
omenjeni šum, ki zmanjšanje posledice kvantizacijsih napak (angl. dither). Za naša ušesa je
manj opazen kot napaka, katero z naključnim vzorcem minimalizira. Najbolj opazna
izboljšava je slišna med tihimi trenutki v zvočnem zapisu. (Beauchamp, 2005)
Napotki za zaključno fazo mešanja zvoka
• Variiranje v dimamičnem razponu, od najtišjih do najglasnejših delov signala, pripomore
k ekspresivni kakovosti dela in preprečuje, da bi občinstvo postalo zamorjeno, saj se le-to
bolj odziva na relativne spremembe v glasnosti, kakor na samo raven glasnosti zvoka.
• Govor je nastavljen nekoliko glasneje kot v realnem svetu, 65 do 70 dB. Občinstvo
ocenjuje jakosti zvoka relativno glede na jakost govora, zaradi tega je pogosto ravno
govor referenca za vse ostale zvoke.
• Ko je ambient vzpostavljen, se lahko njegova glasnost nekoliko zniža, da pridejo do izraza
še drugi zvoki. Od časa do časa je pametno nekoliko pojačati glasnost ambienta, da se le-
ta ponovno vzpostavi ali zaradi pripovednih zahtev.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 58
• Zvok za animacijo nikakor ne more biti mešan po enakih estetskih načelih kot glasba. To
pomeni, da naj bi najvišje jakosti bile v povprečju nekje 20 dB pod maksimumom. Ta
dodaten prostor naj se uporablja modro. Če bo signal vseskozi navit do konca, bo to
zamorilo gledalce, obenem pa bo nivo previsok v primeru, da bo treba izdelati stereo ali
mono zvočni zapis.
• Celotni zvočni zapis je potrebno pozorno poslušati za maskiranje frekvenc. To je pojav,
pri katerem se zvoki enakih frekvenčnih območij prekrivajo, tako da glasnejši preglasijo
tišje. To pride še posebej v poštev pri glasnih zvokih, ki so dinamično pozicionirani.
• Mešanje zvoka je treba vedno izvesti po specifikacijah formata izdaje.
Zvočni zapis za izdajo
Zaključni zvočni zapis (angl. print master) se pošlje urejevalcu slike, kateri ponovno
sinhronizira avdio s sliko (angl. layback) v aplikaciji za urejanje videa. Kombinirani avdio in
video (angl. answer print) se nato še dodatno preveri za možne težave pri predvajanju avdia,
kot je zamik sinhronizacije (angl. sync drift). Ko je le-ta potrjen, se v primeru filma avdio in
video preneseta na video trak, s čimer se ustvari print za izdajo (angl. video release print). Za
format DVD-V se najprej zakodira avdio, ki se nato kombinira z videom (angl. multiplex).
Zaključni zvočni zapisi, ki so namenjeni za film, se pošljejo v laboratorij, kjer poteka
sprememba iz digitalnega v analogne formate. Laboratorij uporablja zaključni zvočni zapis za
pripravo optičnega traku in opcijske datoteke AC-3. (Beauchamp, 2005)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 59
8 PRAKTIČEN PRIMER
Namen projekta je ugotoviti, kako se dinamično in tudi statično pozicioniranje zvočnih
objektov znotraj 5.1-kanalnega prostorskega zvočnega polja razlikuje za isto sceno, posneto iz
dveh različnih perspektiv. Prepričali se bomo o stabilnosti navidezne slike. Zato bomo izdelali
zvočna zapisa za oba posnetka animiranega preleta reaktivnega lovskega letala po sledečem
scenariju.
Na sredi prostranega polja, ki ga bo preletel reaktivni lovec F 15, sta postavljeni dve kameri,
namenjeni snemanju preleta. Prva je postavljena pravokotno na smer preleta, druga pa pod
kotom 60° glede na prvo. V času preleta se na polju poleg glasnih motorjev letala začne
oglašati tudi čriček.
Zgornji odstavek dejansko določa posebne efekte, ki bodo služili za ugotavljanje lastnosti
sistema 5.1. Da pa bo zvočna slika popolna, bomo dodali še govor in glasbeno podlago. Tako
se scenarij še razvije.
Tik preden prileti letalo, pripovedovalec izgovori stavek: »Gledamo prlet lovca F-15.« S tem
pojasni dogajanje na prikazovalniku. Ko se letalo oddaljuje, se pojavi glasba, ki gledalca
pripravi za naslednjo sceno.
To je osnova, iz katere bomo črpali ideje, in bo služila za izvedbo postavljene naloge po že
opisanih treh produkcijskih fazah.
Pri izvedbi praktičnega primera bomo uporabili aplikacije iz nabora sonyeve kreativne
programske opreme (http://www.sonycreativesoftware.com), ki ponuja časovno omejeno
brezplačno testiranje svojih izdelkov. Mešanje zvoka in sinhronizacijo le-tega s sliko bomo
izvajali v programu Vegas Pro 10, ki omogoča ustvarjanje prostorskih zvočnih zapisov v
formatu 5.1 surround. Za osnovno urejanje posameznih zvokov pa bomo uporabili Sound
Forge Pro 10. Prvi je namenjen predvsem za urejanje videa v visoki ločljivosti, drugi pa je
klasični urejevalnik avdio materiala.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 60
Obstaja pa tudi mnogo drugih programov, ki omogočajo ustvarjanje zvoka v formatu 5.1
surround. Popularni so Avid – Pro Tools (http://www.avid.com/us/products/family/pro-tools),
Apple - Soundtrack Pro (http://www.apple.com/finalcutstudio/soundtrackpro) in Steinberg –
Nuendo (http://www.steinberg.net/en/products/nuendo.html).
8.1 Preprodukcija
Glede na scenarij bomo že v predprodukciji skušali ugotoviti, kakšne zvoke bomo potrebovali
za sestavo celotne zvočne podlage animirane scene in jih v veliki meri tudi pripravili za
uporabo v postopku mešanja zvoka.
Iz samega scenarija ugotovimo, da bomo za sfero posebnih efektov vsekakor potrebovali
zvočni posnetek preleta dvomotornega vojaškega lovca in posnetek črička. Seveda pa se naša
analiza v tej fazi še ne konča, saj bi bila zvočna podlaga s samo dvema zvočnima elementoma
precej dolgočasna. Dejstvo pa je tudi, da nikjer na svetu ne obstaja popolna tišina. Tako
ugotovimo, da rabimo še primerno ozadje oziroma ambientalni zvok. Scenarij pravi, da se v
nekem trenutku oglasi čriček. Iz tega lahko predvidevamo, da se opisani dogodek
najverjetneje dogaja poleti, zato bomo priskrbeli še posnetek ali grajen efekt, ki odgovarja
travniku v poletni pripeki. Da bomo poskrbeli še za dodatno slikovitost bomo dodali še efekt
na kanal LFE. Tako bo ta preprosta scena zaživela v čisto novi luči.
Vse potrebne zvočne posnetke smo poiskali v brezplačni knjižnici The Freesound Project
(http://www.freesound.org), ki ponuja uporabo zvočnih datotek v nekomercialne namene,
licencirane pod pogoji Creative Commons. V tej zbirki se nahaja ogromno raznih zvokov v
različnih kakovostih, vendar smo izbrali le tiste, ki ustrezajo minimumu za profesionalni
avdio, kar pomeni, da so vzorčeni s frekvenco 44,1 kHz in bitno globino 16 bit ter so v
formatu wave.
Za glasbeno sfero bomo uporabili enega izmed številnih glasbenih pojektov, ustvarjenih v
prostem času. Za namen uporabe v animirani sceni ga bomo v produkcijski fazi priredili, tako
da bo jakost inštrumentov postopoma naraščala in bo najvišja v trenutku prehoda v novo
sceno. To naj bi zadostilo zahtevi, podani v scenariju.
Izbrali smo formata Dolby Digital AC-3 in 5.1-kanalni wave. Prvi je namenjen za medij
DVD-V, ki omogoča frekvenčni razpon 48 kHz in dinamični razpon 24 bitov. Kot smo že
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 61
zapisali, ta format stiska zvočne datoteke z izgubami. Zato smo se odločili, da opravljeno delo
shranimo še v 5.1-kanalni format LPCM wave s frekvenčnim razponom 48 kHz in
dinamičnim razponom 24 bitov.
Na podlagi scenarija in izbranih zvokov smo izdelali začasni soundtrack, ki je služil kot
nekakšna orientacija, kako naj bi stvari izgledale v končnem izdelku. Pri tem smo že
ugotovili, kateri zvoki so najprimernejši za uporabo in kateri potrebujejo morebitno editiranje,
preden bodo ustrezali kontekstu animiranega dogodka.
8.2 Produkcija
Za čim doslednejšo ponazoritev dogodka je priporočljivo preučiti podobne situacije iz
realnega sveta in scene iz drugih animiranih filmov. S preučevanjem primerov, dosegljivih na
svetovnem spletu, smo dobili občutek, kako se naloge lotijo ostali ustvarjalci in kako
izgledajo posnetki podobnih dogodkov v vsakdanjem življenju. Pri izvedbi se bomo poskušali
čim bolj približati ponazoritvi fizičnega sveta.
Za snemanje govora smo zaprosili glasbeni studio. Tako smo zagotovili profesionalno
izgovorjen in tudi posnet zvok, ki bo služil za potrebo naracije. Tukaj je potrebno omeniti, da
bi v primeru, če bi tekst izgovarjal lik viden na prikazovalniku, bilo treba govor za potrebe
sinhronizacije posneti že v fazi predprodukcije.
Produkcijska faza je, kot smo ugotovili v teoretičnem delu, čas, ki ga lahko izkoristimo za
pripravo in obdelavo vseh elementov, ki se bodo pojavili v soundtracku. Zato smo v tej fazi
nekoliko obdelali zvok za ozadje. To je grajen efekt, ki pa je slišati preveč ponavljajoče, zato
smo mu v programu Sound Forge Pro 10 dodali nekaj naključnih zvokov in obdelali krivuljo
glasnosti. Tako je efekt poslej slišati bolj realističen. Vzorec oglašanja črička smo razrezali na
več krajših delov, ki jih bomo uporabili za variiranje, in pri vseh teh delih uredili preliv v
tišino na začetku in na koncu. Kot smo že opisali, smo priredili tudi glasbo.
Prav tako smo ta čas izkoristili za spremembo zvočnih datotek na višjo kakovost, ki ustreza
izbranemu formatu. Tako smo datoteke pretvorili bitno globino 24 bitov na vzorec in
frekvenco vzorčenja prilagodili na 48 kHz, s čimer smo zadostili pravilu kakovosti izvornega
avdio signala, ki smo ga pojasnili v teoretičnem delu.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 62
Ker je tudi breme izdelave same animacije ležalo na naših ramenih, smo večino časa v fazi
produkcije namenili animiranju in upodabljanju. Vendar pa modeliranje, animiranje in ostali
postopki, povezani s 3D animacijo, niso predmet tega diplomskega dela, zato jih ne bomo
posebej opisovali.
8.3 Postprodukcija
Dokončana animacija pomeni začetek faze postprodukcije, v kateri se zaključi tudi izdelava
soundtracka. Prvi korak na tej poti predstavlja točno določanje pozicije posameznih zvokov
znotraj zvočnega polja. Po že opisanih principih iz teoretičnega dela smo se odločili, da bomo
zvoke pozicionirali po sledečem receptu. Za nas glavni zvok, ki ga predstavlja zvok letala, bo
imel na voljo vseh pet kanalov za natančno uprizoritev gibanja tekom preleta. Ambientalni
zvok bo enakomerno pozicioniran na vse kanale razen centra, saj želimo doseči enakomerno
obkroženost z okoljem, ki bi se v nasprotnem primeru prevesila nekoliko naprej in bi
poslušalca postavila nekako na pol poti med zunanjim opazovalcem in popolno vključenostjo
v dogajanje. Tudi poseben efekt oglašanja črička bomo aplicirali na vse kanale razen centra,
vendar ga bomo pozicionirali nekje v zadnjem delu, da bomo kot poslušalec dobili občutek,
kot da se nahaja za nami. Dodatni nizkofrekfenčni efekt bobnenja bomo pozicionirali na vseh
pet kanalov in tudi na LFE, saj smo ugotovili, da pozicija izvora nizkih tonov ni tako kritična
in je tudi ni možno enostavno locirati. Govorni del bomo pozicionirali na levi in desni kanal,
kot je to standardna praksa za pripovedovanje. Enako bomo storili tudi z glasbo.
Mešanje zvoka - efektov za prvi posnetek
Za začetek je v programu Vegas Pro 10 potrebno ustvariti nov projekt in mu določiti avdio
lastnosti. Te smo določili na podlagi izbranega formata. Tako smo nastavili ustrezne
parametre, kot so frekvenca vzorčenja in bitna globina ter število kanalov, kakor je razvidno s
slike 8.1. Nato smo v program uvozili upodobljeno animacijo v formatu avi z ločljivostjo 640
x 400, kar zadostuje, da lahko vse zvočne elemente ustrezno časovno uskladimo glede na
sliko. Ko je to postorjeno, lahko začnemo z ustvarjanjem soundtracka. Najprej smo, kot
prikazuje slika 8.2, uvozili vse predvidene zvoke, vsakega na svojo avdio stezo, in steze
smiselno poimenovali. V naslednjem koraku smo nastavili jakosti za vsakega od zvokov.
Jasno je, da je najglasnejši zvok reaktivnega letala, katerega krivuljo glasnosti smo nekoliko
prilagodili. Ambientalni zvok smo nastavili na takšno jakost, da je hitro zaznaven, a vendar ne
preglasen. Oglašanje črička pa je za odtenek glasnejše od samega ozadja, da nekoliko izstopa
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 63
in ga je moč razločiti od ostalih zvokov. Posebni basovski efekt smo uvozili dvakrat. Prvič
predstavlja normalen zvok, apliciran na vse zvočnike na povsem nizki, komaj še zaznavni
jakosti. Da se bodo ta in ostali zvoki, ki vsebujejo nizke frekvence pojavili na kanalu LFE,
smo v nastavitvah že na začetku izbrali frekvenčno mejo 80 Hz, ki je namenjena prav za
format DVD-V in reprodukcijo v domačem okolju. Nastavitev je razvidna na sliki 8.1. Drugič
pa smo isti zvok aplicirali samo na kanal LFE pri spremenljivi jakosti, kar skupaj s sistemom
za upravljanje nizkih tonov zagotovi tresoč in slikovit efekt iz subwooferja. Ravno ta dodatna
slikovitost je smisel uporabe kanala LFE, ki smo jo hoteli izkoristiti.
Slika 8.1: Avdio lastnosti
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 64
Slika 8.2: Video in avdio steze v postopku mešanja zvoka
Ko smo bili zadovoljni z začasno zvočno sliko, smo se lotili še pozicioniranja preostalih
zvočnih elementov. Najprej smo poskrbeli za statične zvoke. V center zvočnega polja smo
postavili ambientalni zvok in izključili izhod za centralni kanal. Na desni kanal za surround
smo pozicionirali zvok črička tako, da se nekoliko sliši še na preostalih kanalih razen centra,
kar lahko vidimo na sliki 8.3A. Kot zadnjega smo se lotili pozicioniranja zvoka za premikajoč
se objekt. Zvok mora slediti preletu letala iz leve proti desni strani prikazovalnika, kot
prikazuje slika 8.3B. Pri tem je potrebno poudariti, da se zvok sliši že, preden letalo vidimo,
in traja še nekaj časa po tem, ko letalo izgine iz obzorja. Najpomembneje pa je, da zvok točno
sovpada s položajem letala na prikazovalniku. V raziskavi smo namreč ugotovili, da je
človeški sluh ravno po horizontalni ravnini pred očmi najbolj občutljiv za odstopanje. Zato
smo se posebej potrudili, da je ravno v tem časovnem intervalu zvok točno sinhroniziran s
položajem objekta na prikazovalniku. Za čim večjo natančnost pozicioniranja smo uporabili
avtomatizacijo po ključnih okvirjih, v katerih smo določili položaj zvoka, za vmesne okvirje
pa poskrbi program sam. Zelo pomembni funkciji pri nastavljanju glasnosti, kakor tudi
pozicioniranju, sta predvajanje le ene steze (angl. solo) in izklapljanje posameznih stez (angl.
mute), ki nam pomagata v določenem trenutku ustvarjanja slišati točno to, kar želimo. Celotna
razporeditev stez, jakosti in pozicioniranja zvokov je razvidna s slike 8.2.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 65
A
B Slika 8.3: Pozicioniranje za prvi posnetek
Mešanje zvoka - efektov za drugi posnetek
Ta postopek je zelo podoben prvemu. Kritična sprememba se zgodi le pri pozicioniranju
dinamičnega zvoka, ki ga oddaja reaktivno letalo, in pri oglašanju črička. Ker se je kot
kamere spremenil za 60° v smeri urinega kazalca, to pomeni, da sedaj letalo prileti od zadaj z
leve strani in odleti naprej vstran od nas, kot je razvidno s slike 8.4A. Čriček pa se v tem
primeru nahaja spredaj desno, kot prikazuje slika 8.4B. Ostali zvoki lahko ostanejo
nespremenjeni, saj služijo za ambient, ki se razporedi po vseh kanalih enakovredno. Do te
variacije ni prišlo zaradi spremembe v animaciji, ampak zgolj zaradi spremembe perspektive.
Prav to smo hoteli doseči z namenom, da lahko preučimo, kaj se dogaja z zvokom, ko je le-ta
razporejen po zvočnikih, kot je bilo načrtovano, in kaj se zgodi, če perspektivo spremenimo
za določen kot.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 66
A
B Slika 8.4: Pozicioniranje za drugi posnetek
V obeh primerih mešanja zvoka smo uporabili postopek procesiranja signala, katerega lahko
apliciramo na vsako stezo posebej. Pri posnetku črička smo ugotovili, da kljub že opisanemu
editiranju zvok nima zadostne prostorskosti, v smislu prisotnih odmevov, zato smo dodali
reverb, kot prikazuje slika 8.5, in ga nastavili tako, da se procesiran signal lepo vklaplja v
preostalo zvočno sliko.
Slika 8.5: Procesiranje signala
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 67
Da smo dosegli želene rezultate, je bilo potrebno oba zvočna zapisa kar nekajkrat preizkusno
predvajati in sproti popravljati pomanjkljivosti.
Zaključno mešanje zvoka – dodajanje govora in glasbe
Ko smo s stališča posebnih efektov dosegli želene rezultate, smo v projekta za oba posnetka
dodali še govor in glasbo. Oboje smo pozicionirali na sprednji levi in desni zvočnik, kar smo
definirali že v začetku produkcijske faze. Da je govor slišati malce bolj nadnaravno, smo
dodali reverb, podobno kot pri posnetku črička. Za oba elementa smo pred koncem še fino
nastavili glasnosti, da se le-te ujemajo z že obstoječimi zvoki. Tako smo dobili zaključni
zvočni zapis. Ta se nahaja na DVD-ju v formatih Dolby Digital (.ac3) in LPCM (.wave) kot
priloga 3.
8.4 Analiza
Tekom teoretične raziskave smo ugotovili, da je pri 5.1-kanalnem prostorskem zvoku
reprodukcija stranskih in zadnjih navideznih slik nekoliko slabša na račun boljše vključenosti
v zvočno polje. Izvedeli smo, da je zvok, ki je lociran natančno na mesto, kjer se nahaja
zvočnik, manj občutljiv na spremembo položaja poslušalca, kot tisti, katerega položaj je
umetno poustvarjen s pomočjo navidezne slike.
Da bi se o tem prepričali, smo izvedli poizkus, ki je bil načrtovan tako, da imamo v prvem
posnetku oba kritična zvočna elementa pozicionirana na način, ki naj bi zagotavljal najboljšo
možno reprodukcijo. Tako smo zvok letala dinamično pozicionirali, da se premika od leve
meje zvočnega polja proti desni. Večina dogajanja je tako na sprednjih treh zvočnikih, kjer je
dobra navidezna slika zagotovljena. Nekaj malega signala je, bolj kot za namen
pozicioniranja, za namen vključenosti apliciranega na zvočnika za surround. Zvok črička smo
statično pozicionirali tako, da izhaja iz smeri, kjer bi se po predpisih naj nahajal desni zvočnik
za surround. S tem smo temu zvočnemu elementu zagotovili diskretni izvor, kar pomeni
direktno reprodukcijo brez ustvarjanja navidezne slike. Po pozornem poslušanju večkrat
predvajanega zvočnega zapisa ob spremljavi slike smo potrdili teoretično ugotovitev, da je
5.1-kanalni surround pri predvajanju sprednje navidezne slike učinkovit tudi pri dinamično
pozicioniranih zvokih. Prehod od leve proti desni strani je bil tekoč, tako da nismo opazili
nobenega sesutja navidezne slike. Tudi pri manjših spremembah položaja poslušanja ni bilo
opaziti kakšnih drastičnih sprememb, kar je v neki meri verjetno tudi posledica same narave
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 68
dogodka, saj se letalo premika precej hitro in je tako tudi prehod zvoka dokaj hiter. Oglašanje
črička je s svojim diskretnim izvorom v tem primeru stabilno na svojem mestu in ob
spremembi položaja poslušanja tam ostane tudi, če se premaknemo skoraj do meja zvočnega
polja. Tako znotraj predvidenega območja za poslušanje ni bojazni za kakršno koli popačenje.
Ostali zvoki, ki predstavljajo ambientalno sfero, so, kot smo že opisali, nastavljeni na tako
jakost, da naj bi samo ustvarili občutek naravnega habitata in v predvidenih mejah slušnega
položaja sistem 5.1 to uspešno reproducira.
V drugem posnetku smo celotno perspektivo s stališča gledalca-poslušalca obrnili za 60° s
čimer smo sceno, ki je bila prej prikrojena sistemu 5.1, spremenili do mere za katero smo
predvidevali, da se ta prilagojenost poruši. Sedaj imamo letalo, ki se premika iz levega
zadnjega dela zvočnega prostora proti sprednjemu desnemu delu, pri čemer zvok potuje po
različnih zvočnikih. Levi surround, levi sprednji in centralni sprednji zvočnik prevzemajo
večino reprodukcije, medtem ko desni sprednji in desni surround sedaj predvajata le delček
signala, ki služi bolj za prostorsko vključenost. Po poslušanju smo bili presenečeni, kako
dobro je sistem 5.1 reproduciral opisani dogodek. Na prvi pogled je zgledalo, kot da je
prehod brez napake. Šele s pozornim večkratnim poslušanjem smo ugotovili, da nekje na pol
poti med levim zvočnikom za surround in levim sprednjim zvočnikom pride do anomalij, ki
so slišati podobno, kot bi s pomočjo izenačevalnika spreminjali različne frekvence. Vendar je
na tem mestu potrebno poudariti, da kljub temu, da smo vedeli, kaj lahko pričakujemo, v
prvem predvajanju nismo zaznali nič nenavadnega. Čeprav nimamo pretirano bogatih
predhodnih strokovnih izkušenj s tega področja, smo mnenja, da večina gledalcev v prvo ne bi
opazila, da nekaj ni v redu, sploh če niso naprej podučeni o teh stvareh. Nadalje smo
ugotovili, da je zaznava oglašanja črička nekoliko bolj problematična v drugem, kakor pa v
prvem primeru. V drugem poskusu je zvok črička pozicioniran na desni strani nekje na tretjini
razdalje od desnega sprednjega zvočnika do desnega zvočnika za surround, kar pomeni, da je
poustvarjen s pomočjo navidezne slike. Le-ta ni tako stanovitna, kot če bi se nahajala nekje na
območju sprednjih treh zvočnikov, vendar je vseeno možno locirati položaj črička znotraj
zvočnega polja. Kot smo predvidevali, je ta navidezna slika precej odvisna od položaja
poslušanja. Za ambientalne zvoke se ni v drugem primeru nič spremenilo in so zato obdržali
lastnosti, ki so že bile predvidene. Drugi primer je vsekakor še enkrat potrdil, da sistem 5.1 ni
vsemogočen.
Kot smo že omenili, smo dodali tudi vsebino kanala LFE, ker smo že v teoretičnem delu
spoznali, da je to vsebina svoje vrste. Aplikacija že sama po sebi poskrbi, da se frekvence, ki
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 69
se nahajajo pod določeno mejo, avtomatsko shranijo v kanal LFE. Zato smo z dodatno
vsebino hoteli prikazati, da ta poseben kanal nudi več. Dodani efekt ne pripomore toliko k
realnosti, kot pa k verodostojnosti dogajanja na prikazovalniku. Da smo se o tem prepričali,
smo izklopili nizkotonski zvočnik. Kljub temu, da smo isto vsebino aplicirali tudi na ostale
zvočnike, in jo je dejansko moč slišati, pa nima niti delčka atraktivnosti, ki jo nudi kanal LFE
z ustreznim zvočnikom. To je dokaz, da je LFE res izboljšava, ne samo zvočne slike, ampak
celotne avdio vizualne izkušnje na nizkih frekvencah.
Ob poslušanju obeh zvočnih zapisov z dodanim govorom in glasbo smo opazili, da se
pripovedna vrednost s prisotnostjo govora bistveno izboljša, saj nam pojasni, kateri tip letala
se pojavi na sliki. Glasba pa doda nekaj živahnosti in pričakovanja, kar je bil tudi namen. Oba
elementa do neke mere odvzameta prostor posebnim efektom, ki smo jih predhodno želeli res
razločno slišati, ker smo z njihovo pomočjo ocenjevali sposobnosti sistema 5.1. Vendar se
zavedamo, da morajo v animaciji govor, glasba in posebni efekti soobstojati. Zato je v vsakem
primeru treba sprejeti določene kompromise. Na prvo mesto pa vedno uvrstimo govor.
Na podlagi vseh ustvarjenih zvočnih zapisov smo ugotovili, da ima sistem 5.1 nekatere
pomanjkljivosti, ki bi se jih po eni strani dalo rešiti z večjim številom kanalov, da bi se tako
izognili uporabi navideznih slik, ki so kandidat za povzročanje težav. Po drugi strani pa lahko
rečemo, da se s tem sistemom da doseči zavidljive rezultate pod pogojem, da poznamo
njegove prednosti in slabosti. To smo, z ustvarjanjem vseh zvočnih zapisov, do neke mere
tudi dosegli. Predvidevamo, da bi lahko zvoke, ki so nam v drugem posnetku nekoliko
ponagajali, tudi drugače razporedili. Letalo bi lahko dinamično pozicionirali od levega
zvočnika za surround proti levemu sprednjemu zvočniku in se s tem izognili vpletenosti več
zvočnikov, kar bi pripomoglo k enakomernejšemu prehodu. Vseeno pa se le-ta ne bi mogel
primerjati s prehodom iz prvega primera. Tudi črička bi lahko pozicionirali točno v smeri
desnega zvočnika in mu s tem zagotovili večjo diskretnost, kakor smo to storili v prvem
primeru. Res je, da bi s tem deformirali razmerje med vizualno in avdio perspektivo, vendar je
iz ustvarjalnega vidika to sprejemljivo ali mogoče še bolj zaželeno, saj animacija večkrat
promovira svobodo domišljije in svojevrstno verodostojnost. Mi smo le hoteli ugotoviti, kaj
se z zvoki zgodi v bolj kot ne naključnih situacijah. Pri tem pa smo se naučili, da je bolje, kot
z glavo skozi zid, iti po smernicah, katere nam določa sistem. To pomeni, da se pri pripravi
vsebin za 5.1-kanalni zvok potrudimo in izvedemo mešanje zvoka na način, za katerega
vemo, da bo pri reprodukciji izkoristil vse pozitivne lastnosti sistema in prikril morebitne
pomanjkljivosti.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 70
9 SKLEP
Izdelava prostorskega zvočnega zapisa za animacijo je precej kompleksnen proces. Od
ustvarjalca zahteva poleg umetniške žilice tudi poznavanje številnih medijskih in tehničnih
področij. Prostorski zvok ima jasne prednosti pred konvencionalnim stereo zvokom, kar
dokazuje nenehen razvoj na področju prostorskega zvoka. Prav te pozitivne lastnosti so
razlog, zakaj smo se lotili te teme. Obdelali smo glavne značilnosti prostorskega zvoka,
specifične za sistem 5.1. Le-ta za učinkovito delovanje izkorišča nekatere lastnosti človeškega
sluha, ki smo jih odkrili z raziskovanjem področja psihoakustike.
Naloga zvoka je, da preko govora, glasbe in posebnih efektov pomaga animaciji pri podajanju
vsebine. Zato smo se odločili podrobneje spoznati te tri pojavnosti zvoka v kontekstu
animacije. Tako smo se naučili, kako jih lahko najučinkoviteje uporabimo pri svojem
udejstvovanju. Le-to je v procesu nastajanja animacije in zvoka zanjo razdeljeno v tri sklope.
To so preprodukcija, produkcija in postprodukcija. Vsak sklop vključuje postopke, ključne za
nastanek uspešnega zvočnega zapisa.
Vse to znanje smo uspešno aplicirali na praktičnem primeru, za katerega smo poleg zvoka
izdelali tudi animacijo, ki je služila za uskladitev obeh elementov. Seveda tukaj ni šlo brez
uporabe sodobne digitalne tehnike, za katero verjamemo, da je s svojim razvojem
poenostavila ustvarjanje tako zvoka kot slike za animacijo, v primerjavi z orodji, ki so bila na
voljo v začetkih animacije.
Za pripravo zvočnega zapisa, za večino gledalcev povsem samoumevnega dela avdio vizualne
predstavitve, smo porabili veliko časa, še več pa je bilo potrebnega osvojenega znanja. Tako
kot prisotnosti zvoka, dokler ga ne zmanjka, se večina gledalcev ne zaveda pomena
prostorskega zvoka, dokler ga ne izkusi. Tisti pa, ki uživamo v vseh podrobnostih, ki so
namenjene izboljšanju naše zaznave sveta, ki nas obkroža, bomo vedno v iskanju perfekcije.
To se dogaja tudi na področju prostorskega zvoka, ki postaja vedno bolj prepričljiv in
podoben naravnemu.
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 71
VIRI
AES Technical Council Document AESTD1001.1.01-10, Multichannel surround sound
systems and operations, Audio Engineering Society, New York, najdeno julija 2010 na
spletnem naslovu:
http://www.aes.org/technical/documents/AESTD1001.pdf
ATSC Doc A/54A, Recommended practice: guide to the use of the ATSC digital television
standard, including corrigendum No. 1, Advanced Television Systems Committe, najdeno
julija 2010 na spletnem naslovu:
http://www.atsc.org/cms/standards/a_54a_with_corr_1.pdf
Beauchamp R., Designing sound for animation, Elsevier Inc, Oxford, 2005
Benade A. H., Kent E.L., Musical relations and the ear, Acoustical Society of America, New
York, 1964
Blauert J., Spatial hearing: the psychophysics of human sound localization, 2. Izdaja,
Massachusetts Institute of Technology, Cambridge , 1999
Chion M., Audio-vision: sound on screen, Columbia University Press, New York, 1994
DOLBY S05/14926/15996, 5.1-channel music production guidelines, 3. Izdaja, Dolby
Laboratories Inc, San Francisco, 2005, najdeno avgusta 2010 na spletnem naslovu:
http://www.dolby.com/uploadedFiles/zz-
_Shared_Assets/English_PDFs/Professional/4_Multichannel_Music_Mixing.pdf
Erjavec K., Novinarska kakovost, Založba FDV, Ljubljana, 1999
Forlenza J., Stone T., Sound for Picture: An Inside Look at Audio Production for Film and
Television, MixBooks, Emeryville, 1993
Friske J., (Dimic M.), Uvod v komunikacijske študije, FDV, Ljubljana, 2005
Holman T., Surround sound up and running, 2. Izdaja, Elsevier Inc, Oxford, 2008
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 72
Kavčič B., Vrdlovec Z., Filmski leksikon, Modrijan, Ljubljana, 1999
Peacock R. B., The art of moviemaking: script to screen, Prentice-Hall Inc, New Jersey, 2001
Sinclair I.R., Audio & hi-fi handbook, 3. Izdaja, Newnes, Oxford, 1998
Slovar glasbenih tujk, Gimnazija in srednja kemijska šola Ruše, Ruše, 1994
Slovar slovenskega knjižnega jezika, najdeno novembra 2010 na spletnem naslovu:
http://bos.zrc-sazu.si/sskj.html
Splichal S., Komunikološka hrestomatija 2, Založba FDV, Ljubljana, 1999
Theile G., On the localisation in the superimposed soundfield, Technische Universität Berlin,
Berlin, 1980
Theile G., Kügler Ch., Loudspeaker reproduction: study on the subwoofer concept, 92nd AES
Convention, Wien, 1992, najdeno avgusta 2010 na spletnem naslovu:
http://www.aes.org/e-lib/browse.cfm?elib=6798
Wellins M., Storytelling trough animation, Charles River Media Inc, Hingham, 2006
Yewdall D. L., Practical art of motion picture sound, Elsevier Inc, Woburn, 1999
http://en.wikipedia.org/wiki/Ac3, najdeno oktobra 2010
http://en.wikipedia.org/wiki/CinemaScope, najdeno oktobra 2010
http://en.wikipedia.org/wiki/Cinerama, najdeno oktobra 2010
http://en.wikipedia.org/wiki/Digital_cinema, najdeno oktobra 2010
http://en.wikipedia.org/wiki/Fantasound, najdeno oktobra 2010
http://en.wikipedia.org/wiki/Head-related_transfer_function, najdeno avgusta 2010
http://en.wikipedia.org/wiki/Todd_AO, najdeno oktobra 2010
http://en.wikipedia.org/wiki/10.2, najdeno novembra 2010
http://en.wikipedia.org/wiki/22.2, najdeno novembra 2010
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 73
http://www.aes.org, najdeno septembra 2010
http://www.apple.com/finalcutstudio/soundtrackpro, najdeno novembra 2010
http://www.avid.com/us/products/family/pro-tools, najdeno novembra 2010
http://www.dolby.com, najdeno avgusta 2010
http://www.dts.com, najdeno avgusta 2010
http://www.iosono-sound.com, najdeno novembra 2010
http://www.sdds.com, najdeno avgusta 2010
http://www.smpte.org, najdeno septembra 2010
http://www.steinberg.net/en/products/nuendo.html, najdeno novembra 2010
http://www.stokowski.org, najdeno oktobra 2010
http://www.sonycreativesoftware.com, najdeno oktobra 2010
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 74
PRILOGE
Priloga 1: Preglednice lastnosti formata LPCM
a) Hitrosti vzorčenja (Beauchamp, 2005)
Hitrost vzorčenja (kHz) Aplikacija 44.1 CD 48 DV kaseta, DVD-V 96 DVD-V, DVD-A
b) Bitne globine in kvantizacijska ločljivost (Beauchamp, 2005)
Bitna globina (bit) Kvantizacijska ločljivost (stopnje) Aplikacija 16 65530 CD, DV kaseta 20 1048576 DVD-V,DVD-A 24 16777216 DVD-V,DVD-A
c) Bitne globine, dinamični razpon in razmerje signal/šum (Holman, 2008)
Bitna globina Dinamični razpon (dB) Razmerje signal/šum (dB) 16 96,3 76,3 20 120,4 100,2 24 144,5 124,5
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 75
Priloga 2: Aplikacija kanalov na steze v zvočnem zapisu 5.1
Standard Steza 1 2 3 4 5 6 7 8 ITU, SMPTE Kanal L R C LFE Ls Rs Opcijsko* Opcijsko*
DTS Kanal L R Ls Rs C LFE Opcijsko* Opcijsko* FILM Kanal L Ls C Rs R LFE Opcijsko* Opcijsko*
*Opcijsko za format stereo (Lo, Ro) ali matrično vkodiran format stereo (Lt, Rt).
L = Levo R = Desno C = Center LFE = Izboljšanje nizkih frekvenc Ls = Surround levo Rs = Surround desno Lo = Samo Levo Ro = Samo Desno Lt = Levo (matrično vkodiran) Rt = Desno (matrično vkodiran)
Stanko Perko – PROSTORSKI ZVOK V RAČUNALNIŠKI ANIMACIJI | 76
Priloga 3: Zvočni zapis praktičnega primera (CD)