Zvuk je mechanické vlnenie, ktoré sa šíri prostredím (napr. vzduchom). Keby sme nemali v našom okolí vzduch, zvuk by sme nepočuli. Vo vzduchoprázdne vesmíru sa zvuk nešíri.
Zvuk počujeme, pretože naše uši sú citlivé na tieto vlny. Pravdepodobne najjednoduchším typom zvukovej vlny na pochopenie, je krátka, náhla udalosť ako napríklad tlesknutie. Pri tlesknutí rukami sa vzduch, ktorý bol medzi rukami vytlačí do strán. To zvýši tlak vzduchu v blízkosti rúk, pretože viac molekúl bude natlačených do menšieho priestoru. Vysoký tlak vymrští molekuly vzduchu preč všetkými smermi rýchlosťou zvuku, čo je okolo 340 metrov za sekundu. Keď zvuková vlna dorazí ku nášmu uchu, stlačí náš bubienok a my počujeme tlesknutie.
Tlesknutie je krátka udalosť, ktorá spôsobí jednu tlakovú vlnu, ktorá rýchlo zanikne. Predchádzajúci obrázok znázorňuje priebeh vlny, ktorý je typický pre tlesknutie. Priebeh vlny sa znázorňuje tak, že vodorovná os predstavuje čas a vertikálna os predstavuje tlak. Za úvodný vysoký tlakom sa tlak rýchlo znižuje až oscilácie zaniknú.
Iným častým typom zvukových vĺn sú periodické vlny. Ak zvoníme zvončekom, za úvodným výkyvom tlaku (ktorý je trochu podobný tlesknutiu), nasledujú rovnako veľké výkyvy, ktoré spôsobuje vibrácia zvončeka. Ak zvonček neustále zvoní, vibruje s určitou frekvenciou v závislosti od veľkosti a tvaru zvončeka, a to spôsobuje, že okolitý vzduch sa rozvibruje s rovnakou frekvenciou. To spôsobí tlakové vlny, ktoré putujú zvukom preč od zvončeka rýchlosťou zvuku. Tlakovú vlnu spojitej vibrácie môžeme znázorniť takto:
Mikrofón obsahuje malú membránu, ktorá môže voľne vibrovať okolo mechanizmu, ktorý prevedie pohyb membrány na elektrické signály. (Presný elektrický mechanizmus závisí od typu mikrofónu.) Akustické vlny sú teda prevedené na elektrické vlny pomocou mikrofónu. Vyšší tlak väčšinou zodpovedá väčšiemu elektrickému napätiu a naopak.
Magnetofón prevedie elektrické vlny, ktoré sa šíria vodičmi, na magnetické signály, ktorá sa zaznamenajú na pásku. Pri prehrávaní pásky je celý proces obrátený, z magnetických signálov sa vytvoria elektrické signály a tie spôsobia vibráciu membrány reproduktora, ktorý väčšinou používa elektromagnet.
Nahrávanie na pásku je príkladom analógového nahrávania. Audacity poskytuje digitálne nahrávanie - nahrávanie ktoré je kúskované tak, aby mohlo byť zaznamenávané číselne do počítača. Digitálne nahrávanie má oproti analogovému veľa výhod. Digitálne súbory môžu byť mnohokrát skopírované, bez toho aby záznam stratil kvalitu, môžu byť napálené na audio CD alebo zdieľané cez Internet. Digitálne audio súbory sa tiež dajú oveľa jednoduchšie upravovať než analógové pásky.
Hlavné zariadenie, ktoré sa používa pri digitálnom zázname zvuku, je Analogovo-digitálny prevodník (ADC). ADC zachytáva v daných intervaloch elektrické napätie a reprezentuje ho v číselnej podobe. Tieto čísla sa potom ukladajú v počítači. Pri rýchlosti zachytávania nekoľko tísíckrát za sekundu získame ceľkom dobré priblíženie k originálnemu audio signálu:
Káždý bod na obrázku predstavuje jednu zvukovú vzorku. Kvalitu digitálneho záznamu ovplyvňujú dva faktory:
Frekvencia vzorkovania: Frekvencia akou sa vzorky zachytávajú alebo prehrávajú, ktorú meriame v Hertzoch (Hz) alebo v počte vzoriek za sekundu. Audio CD má frekvenciu vzorkovanía 44 100 Hz, ktorú skrátene zapisujeme 44,1 KHz. Táto vzorkovacia frekvencia je v Audacity predvolená, pretože audio CD formát je veľmi rozšírený.
Formát vzorky alebo veľkosť vzorky: Toto je počet číslic v digitálnej reprezentácii každej vzorky. Vzorkovaciu frekvenciu považujeme za vodorovnú presnosť digitálnej zvukovej vlny a formát vzorky zasa za zvislú presnosť. Audio CD používa presnosť 16 bitov, čo predstvuje zhruba 5 desiatkových číslic.
Vyššia vzorkovacia frekvencia umožňuje presnejšie zaznamenávať vyššie zvukové frekvencie. Vzorkovacia frekvencia by mala byť najmenej dvojnásobná oproti najvyššej frekvencii zvuku, ktorú zachytávame. Ľudia nemôžu počuť frekvencie nad 20,000 Hz preto bola pre audio CD zvolená frekvencia 44 100 Hz, pomocou ktorej dokážeme zaznamenať všetky počuteľné frekvencie. Na diskoch DVD-Audio sa čoraz častejšie začínajú používať vzorkovacie frekvencie 96 a 192 KHz, ale väčšina ľudí nedokáže počuť rozdiel.
Vyššia veľkosť vzoriek umožňuje väčší dynamický rozsah - hlasnejšie hlasné zvuky a tichšie tiché zvuky. Ak poznáte stupnicu decibelov (dB), dynamický rozsah audio CD je teoreticky 90 dB, ale v skutočnosti je kvalita zvukov najmenej o -24 dB znížená. Audacity podporuje dve dodatočné veľkosti vzoriek: 24-bitov, ktorá sa často používa pri digitálnom zázname, a 32-bitovú plávajúcu, ktorá poskytuje takme nekonečný dynamický rozsah a zaberie iba dvojnásobok toho, čo 16 bitové vzorky.
Pri prehrávaní digitálneho zvuku sa používa Digitalno-analogový prevodník (DAC). Tento preberá vzorky a nastavuje napätie na analógovom výstupe, čím vytvára signály, ktoré pred tým analogovo-digitálny prevodník zachytil z originálneho zvuku a vytvoril z nich vzorky. DAC to robí tak dobre, ako mu to umožňuje súčasná technika, preto kvalita zvuku prvých CD prehrávačov nebola veľmi dobrá. V súčsnosti DAC prevodníky prevzorkovávajú signál aby bol spoitejší. Kvalitu zvuku ovplyvňuje aj kvalita filtrov DAC prevodníkov. Filtre sú súčasťou mnohých častí tvoriacich DAC prevodník.
V počítači je zvuková karta - môže to byť samostatná karta, ako napríklad SoundBlaster, alebo to môže byť karta zabudovaná v počítači. V oboch prípadoch zvuková karta obsahuje Analogovo-digitálny prevodník (ADC) pre nahrávanie a Digitálno-analogový prevodník (DAC) pre prehrávanie zvuku. Operačný systém (Windows, Mac OS X, Linux, atď.) komunikuje so zvukovou kartou, ktorá nahráva a prehráva zvuky a Audacity komunikuje s operačným systémom, ktorý zachytáva zvuk do súborov, upravuje ich a mixuje stopy počas prehrávania.
Existujú dva hlavé typy uloženia audio súborov do počítača:
PCM je skratkou pre Pulse Code Modulation. To je pomenovanie pre techniku záznamu, ktorú sme opisovali vyššie, v ktorej každé číslo v digitálnom audio súbore prestavuje jednu vzorku z priebehu zvukovej vlny. Najbežnejšími príkladmi PCM súborov sú WAV súbory, AIFF súbory a Sound Designer II súbory. Audacity podporuje WAV, AIFF a mnoho ďalších PCM súborov.
Ostatné typy predstavujú komprmované súbory. Skoršie formáty používaly logaritmické kódovanie aby sa získal dynamickejší rozsah a bolo potrebných menej bitov pre každú vzorku. Príkladom sú kódovania u-law alebo a-law formátu Sun AU. Moderné komprimované audio súbory používajú sofistikované psychoakustické algoritmy, ktoré reprezentujú vybrané frekvencie audio signálu, aby sa ušetrilo miesto. Príkladom sú napríklad formáty MP3 (MPEG I, layer 3), Ogg Vorbis a WMA (Windows Media Audio). Audacity podporuje MP3 a Ogg Vorbis, ale nepodporuje neslobodný WMA formát alebo MPEG4 formát (AAC), ktorý používa iTunes od spoločnosti Apple.
For details on the audio formats Audacity can import from and export to, please check out the Fileformats page of this documentation. Nezabudnite, že MP3 neukladá nekomprimované PCM audio dáta. Keď vytvoríme MP3 súbor, zákonite sa musí o niečo znížiť kvalita, na oplátku však získame súbor bude menej zaberať na disku.