В якому форматі краще слухати музику. Три кити lossy

В якому форматі краще слухати музику. Три кити lossy

Розібратися в цифрових аудіоформатах зовсім не просто. Зробити однозначний висновок, в якому саме форматі краще слухати музику, і того складніше. Якщо подивитися порівняльну таблицю аудіоформатів у «Вікіпедії», в очах почне рябити від стовпчиків мовчазних цифр. Спробуємо розібратися, що за цим стоїть.

Відразу обмовимося, що стаття говорить ТІЛЬКИ про загальні характеристики і не буде включати в себе деякі подробиці. У майбутньому Лайфхакер проведе власне неупереджене дослідження. А сьогодні спробуємо узагальнити вже так чи інакше відомий досвід.


Є аналог і цифра.

Аналог - добре, але недовговічно і незручно. Тому аналогові носії, незважаючи на високі продажі вінілу, не повернуться.

Аудіоцифра може бути трьох основних типів:

  • у форматі, що не використовує стиснення;
  • у форматі, що використовує стиснення без втрат (lossless);
  • у форматі, що використовує стиснення з втратами (lossy).

На перший погляд, більш перспективні формати, що використовують стиснення без втрат. Це не завжди так, про що ми докладніше розповімо в одному з наступних матеріалів. Формати без стиснення не мають будь-якого сенсу, крім зберігання майстер-записів, необхідних при створенні аудіоконтенту. Вони легше піддаються відновленню. Для зберігання і прослуховування домашніх записів зайві.

З багатьох параметрів цифрового аудіо користувача в першу чергу повинні хвилювати частота дискретизації (точність оцифрування аналогового сигналу за часом), розрядність (точність оцифрування по амплітуді - гучності), бітова біта (кількість інформації, що міститься в файлі, в перерахунку на секунду).

Сьогодні поговоримо про lossy.


Для стисненого звуку дуже важливо поняття психоакустичної моделі - уявлення науковців та інженерів про те, як людина сприймає звук. Вухо сприймає весь спектр акустичних хвиль. Однак обробляє сигнали мозок.

Довідкова величина чутого людиною діапазону становить від 16 Гц до 20 кГц, але одночасно чути і усвідомлювати всі звуки, що надходять, він не здатний.

Слух дискретний, і його звукова сприйнятливість нелінейна.

Сучасні психоакустичні моделі досить точно оцінюють людський слух і постійно поліпшуються. На ділі, незважаючи на запевнення любителів музики, музикантів і аудіофілів, для середньостатистичного нетренованого слуху початковий вигляд MP3 в максимальній якості став гранично сприйманим. Винятки є, їх не може не бути. Але вони не завжди легко помітні при сліпому прослуховуванні.

Формати, які використовують психоакустичні моделі стиснення

Таких форматів для стиснення аудіо з втратами досить багато. Найбільш поширені сьогодні наступні.

OGG (Vorbis)

Взагалі, файл з розширенням * .ogg є «контейнером»: всередині можуть знаходитися кілька звукових записів з власними тегами і характеристиками. Найчастіше збережені файли стискаються кодеком Ogg Vorbis, хоча можуть використовуватися й інші, в тому числі MP3 або FLAC.

Як його основні переваги варто назвати великий діапазон можливих параметрів при кодуванні: частота дискретизації звуку може досягати 192 кГц, розрядність - 32 біт. За замовчуванням OGG використовує змінний бітовий бітовий запис (хоча при показі властивостей це не вказується), який може досягати 1 000 кбіт/с.


MP3

На відміну від вільного OGG, MP3 розроблений дуже важливим для сучасної акустики Товариством Фраунгофера - об'єднанням інститутів прикладних досліджень Німеччини. У середовищі аудіофілів, до речі, це вкрай шанована контора, правда, зізнаватися вони в цьому не люблять. Але за їх розробками пильно стежать.

На відміну від OGG, може мати як змінні (VBR), так і постійні бітові (CBR). До речі, саме завдяки MP3 виявилося, що не кожен запис може бути якісно кодований з змінним бітом (причини дивіться вище, алгоритми кодування та їх результати в даному випадку можуть бути різними при кодуванні одного і того ж джерела).

Зважаючи на похилий вік MP3 має значні обмеження: розрядність може бути 16-24 біта, частота дискретизації виражається тільки в дискретних значеннях (8, 11,025, 12, 16, 22,05, 24, 32, 44,1, 48), бітрейт обмежений 320 кбіт/с. До того ж у звичайній версії MP3 число каналів обмежено двома.

AAC

Ті ж граблі, тільки в профіль. Теж розробка Товариства Фраунгофера. Більш пізня і використовує іншу психоакустичну модель, більш сучасну. Загальнодоступна інформація дозволяє зробити висновок: так, їм вдалося поліпшити власне творіння.

Навіть якщо спиратися на найпростіші цифри, AAC - більш гнучкий формат. Розрядність файлів, отриманих за допомогою цієї розробки, становить від 16 до 24, частота дискретизації теж при бажанні дозволить не втратити звукової картини і лежить в діапазоні 8-192 кГц. Потік даних взагалі наближається до таких у lossless-форматів (до 512 кбіт/с), при тому що максимальна кількість каналів AAC-файлів досягає 48.


Який формат варто назвати однозначно кращим

Якщо врахувати, що AAC - переосмислений через десяток років MP3, то вибір на його користь. При бажанні має сенс порівнювати тільки MP3 і OGG. Давайте подивимося на картинки, зроблені шановним Андрієм Аспідовим з ixbt.com:

На графіках - хороший AudceCD, стиснутий OGG зі змінним бітом 350 кбіт/с і MP3 з використанням Lame. Чим нижче розташовується графік, тим ближче звучання до оригіналу. Виходить дуже цікава картина. Незважаючи на те, що MP3 володіє явно зрізаними високими частотами, на відміну від OGG, в якому видно завал нижче 2 кГц.

Частотно-часовий розподіл звуку говорить про не менш цікаві речі. При постійному бітові 320 кбіт/з MP3 майже збігається з оригінальним записом. Здається, тепер все встає на свої місця. Але... Насправді все ще більше заплутується.

Навіщо взагалі користуватися lossy, коли є доступний lossless

Здоровий глузд.

Справа в тому, що більша частина аналогових записів не містить тієї кількості інформації, яку необхідно було б зберігати у високоякісних форматах. Не варто забувати, що рідною частотою дискретизації для CD є 44,1 кГц, квантування - всього 16 біт.


Попередні графіки непогано демонструють високу точність передачі MP3. Адже для аудіокасети, магнітної стрічки (якщо, звичайно, це не майстер-тейп) характеристики AudceCD недосяжні. Та й для масового студійного обладнання можливість запису аналогового звуку, відповідного AudceCD, з'явилася відносно недавно. Немає ніякого сенсу оцифровувати у FLAC (і тим більше в WAV) концертний запис або платівку з доцифрової епохи, особливо зроблені з магнітних носіїв. Вони не містять тих спектрів і тієї кількості інформації, які можуть зберігати контейнери без стиснення.

Що змінилося сьогодні

Рідкісний звукорежисер робить цифровий майстер-запис (з яким потім проводиться розмноження на фізичні носії), використовуючи сучасні технології на повну котушку. Тому шанс того, що 24-бітний трек насправді всього лише 16-бітний, вкрай високий.

Аналоговий високоякісний запис на високоякісному обладнанні сьогодні зустріти ще складніше - якщо тільки у фанатів подібного звучання, таким, наприклад, є Джек Вайт, екс-лідер групи White Stripes. При цьому частина його записів відноситься до варіацій lo-fi, і шукати там позамежні звукові характеристики доріжки стає своєрідним задоволенням для гурманів.

Якщо уявити собі ідеальний вихідник, то тільки тренований слух або прослуховування на якісному аудіообладнанні дозволить знайти стислий файл. І вже спираючись на це (і не забуваючи про сприйняття), варто зробити наступний висновок:

Необхідним і достатнім для середньоцінового обладнання є AAC, за відсутності якого (і за відсутності вихідників, які можна кодувати в AAC) - MP3 з постійним бітрейтом 320 кбіт/с, створений за допомогою кодека Lame 3.93 (рекомендовані ключі при декодуванні: —cbr -b320 -q0 -k -m s).


Виняток складають записи, спочатку отримані у високій якості, скажімо, записані на DVD-Audio, SACD, або записи, спочатку зібрані в DSD (або аналогічному форматі) з високим бітрейтом.

Хоча деякі особливості у lossless є. І про них ми розповімо наступного разу.

Автор не любить Apple. Автор дуже цінує досягнення «фраунгоферів» і був гранично здивований, дізнавшись, що AAC - їхня робота.:)

Image

Publish modules to the "offcanvas" position.