MR3: минуле, справжні, майбутнє "

Діджитал 29 червня 2022 Перегляди: 236

Автор: Олександр Сергійович Такиєв

Короткий вміст.
Вступ
Революція звуку
MR3 зсередини: психофізіологія звуку
Так от повернемося до наших фреймів. При високій якості MP3, а це bitrate ауд 320 кbs, для кодування фреймів застосовуються тільки математичні алгоритми стиснення. Якість при цьому абсолютно не страждає, але і розмір зменшується всього в чотири рази, тобто коефіцієнт стиснення такий, який би дав звичайний архіватор; саме тому файли формату MR3 практично не вжимаються звичайними архіваторами. При зменшенні смуги пропускання (bitrate) до 256 kbs і нижче, в справу вступають ті самі алгоритми видалення «» непотрібних «» звуків, які засновані на особливостях сприйняття звуку людським вухом, так звана психоакустична модель «». Процеси видалення «» непотрібних «» звуків називаються квантуванням. Чим менше bitrate, тим жорсткіше йде квантування.
Якість вимагає жертв
Шлях до перемоги: тріумф звуку
Ця музика буде вічною...
Глосарій

Короткий вміст.

1. Вступ
2. Революція звуку
3. MR3 зсередини: психофізіологія звуку
4. Якість вимагає жертв
5. Шлях до перемоги: тріумф звуку
6. Ця музика буде вічною...
7. Глосарій

Вступ

Цей найпопулярніший на сьогоднішній день цифровий формат аудіозжати, був розроблений кілька років тому невеликою німецькою фірмою Fraunhofer IIS. Європейська корпорація THOMSON активно підтримала новоявлений формат і доклала всіх зусиль до його найшвидшого поширення. Зокрема за її підтримки новачок став одним зі стандартів аудіозжаття сімейства MPEG1, MPEG2 і отримав назву MPEG Layer3 або більш звичне нам MP3.

Революція звуку

Появу цього формату на світ більш доречно назвати тихою революцією. Революцією - тому що до MP3 жоден формат звукових файлів не міг забезпечити таку якість при такому відносно невеликому розмірі. Єдиний на той момент мережевий формат .RA (real audio) інакше ніж знущанням над слухом не назвеш. MPEG Layer3 замислювався саме як "вбивця" "цього убогого монополіста, велетня на глиняних ногах. MP3 - це формат, розроблений спеціально для мережі Internet, для швидкого пересилання якісного звуку куди завгодно. Саме тому MP3 є потоковим форматом, що це означає буде розглянуто надалі. Здатність цього алгоритму стиснення зменшувати розмір звукових файлів практично без втрати якості, виглядала по тих часах абсолютно фантастично. Адже навіть під час кодування з максимальною шириною потоку (bitrate) дорівнює 320 kbs (кілобіт на секунду), а ця якість звуку практично невідлична від оригінального, розмір вихідного WAV файла зменшується в чотири рази!

Так, це була революція, але дуже дивна революція. Адже цей унікальний алгоритм на початку свого існування висів буквально на волосині. Повна відсутність реклами, ніяких програвачів музики даного формату, крім фірмового від Fraunhofer IIS, який відрізнявся крайньою убогістю дизайну, моторошним управлінням і непомірними системними вимогами. Додайте ще й колосальні апетити самих розробників, які хотіли за свої кодеки (CODEC - COder/DECoder) досить чималі суми (схожа ситуація зараз з деякими форматами сімейства AAC) і відсутність музики як такої, на відміну від солідних покладів музики у форматі RA. Ці фактори цілком могли загубити новонародженого відразу ж після пологів. І всі любителі хорошої музики повинні сказати величезне спасибі тим відомим і безіменним розробникам freeware MP3 CODEC, які не дали творцеві цього формату фірмі Fraunhofer IIS через свою маркетингову дурість і жадібність погубити геніальне творіння.

Так само слід відзначити ту важливу роль яку зіграв популярний програвач WinAMP в поширенні формату MP3. Цей плеєр першим надав ту зручність, якої так не вистачало фірмовим програвачам. Потім, як я вже говорив, цей формат помітила компанія THOMSON, і з цього почався переможний марш MP3 по всьому світу.

MR3 зсередини: психофізіологія звуку

Цей формат використовує дуже складний алгоритм кодування. На відміну від звичайних архіваторів, яким потрібно примудритися стиснути інформацію таким чином, щоб після вилучення з архіву в ній не змінилося жодного біта, MP3 переслідує дещо інші цілі. Крім математичних алгоритмів стиснення, в цьому форматі присутній так само складний алгоритм видалення непотрібної звукової інформації, заснований на психолого-фізіологічних особливостях організму людини. Спробую зупиниться на даному моменті дещо детальніше.

Як вже говорилося, MP3 є потоковим форматом. Це означає, що звукова інформація при кодуванні розбивається на рівні за тривалістю ділянки, які називаються фреймами. Всі фрейми взаємно незалежні. Кожен з цих кадрів кодується окремо зі своїми параметрами і має заголовок, в якому ці параметри описані. При відтворенні послідовність декодованих кадрів і породжує безперервне звучання записаного звуку.
Які переваги дає даний підхід? По-перше, можливість перемотки, оскільки можливий легкий перехід до довільного фрейму, і відтворення звуку саме з цього місця. По-друге, саме ця структурна особливість і робить MP3 за справжнім мережевим форматом. Завантаживши перші кілька кадрів в оперативну пам'ять або дисковий кеш, програвач починає їх відтворювати, при цьому одночасно підвантажуючи нові фрейми, чим досягається безперервність відтворення. І нарешті, якщо ви не змогли цілком завантажити MP3 файл з мережі Internet, то нічого страшного, музику все одно можна буде слухати, просто програвач дійде до того місця, на якому обірвався зв'язок і зупиниться.

Так от повернемося до наших фреймів. При високій якості MP3, а це bitrate ауд 320 кbs, для кодування фреймів застосовуються тільки математичні алгоритми стиснення. Якість при цьому абсолютно не страждає, але і розмір зменшується всього в чотири рази, тобто коефіцієнт стиснення такий, який би дав звичайний архіватор; саме тому файли формату MR3 практично не вжимаються звичайними архіваторами. При зменшенні смуги пропускання (bitrate) до 256 kbs і нижче, в справу вступають ті самі алгоритми видалення «» непотрібних «» звуків, які засновані на особливостях сприйняття звуку людським вухом, так звана психоакустична модель «». Процеси видалення «» непотрібних «» звуків називаються квантуванням. Чим менше bitrate, тим жорсткіше йде квантування.

За якими критеріями оцінюється «» потрібність «» і «» непотрібність «» звуків? Переважна кількість кодеків викидає звуки, які вважаються такими, що виходять за поріг чутності людини. При цьому за значення порогу, так би мовити de fakto, приймається величина рівна 16kHz. Незважаючи на те, що цей поріг визнаний азбучною величиною і вписаний у всі підручники з фізики, цей підхід неправильний. Люди дуже різноманітні за своїми фізіологічними особливостями. Крім того, потрібно враховувати, що у молоді слуховий поріг набагато вище, ніж у літніх людей, і запросто може перевищувати цю середньостатистичну величину. Так само багато залежить від інтенсивності сигналу. Отже, видалення частот вище 16kHz абсолютно неприйнятно для високих бітрейтів, що претендують на CD якість, але цілком доречно для низьких бітрейтів, де якість приноситься в жертву розміру.

Іншим критерієм, за яким оцінюється «» непотрібність «» звуку, є умова заснована на такій особливості людського слуху, як нездатність більшості людей розрізняти сигнали, що за потужністю лежать нижче певного рівня, причому цей рівень різний для різних частотних діапазонів. При використанні психоакустичної моделі кодування MP3 CODEC автоматично викидає малопотужні, нечутні частоти. На жаль, знову таки, люди не однакові і ті, хто в змозі розрізнити саме ці частоти, часто скаржаться на втрату якості звучання при кодуванні, тоді як середньостатистична більшість цього не помічає.

Але найголовнішою особливістю психоакустичної моделі кодування MP3 є так званий ефект маскування. Саме завдяки цьому ефекту вдається так сильно стискати вихідні аудіодані. Суть цього ефекту в тому, що слабкий сигнал одного діапазону частот часто маскується більш потужним сигналом сусіднього діапазону, якщо він присутній в аудіозапису, або потужним сигналом, попереднього фрейму. Цей сильний сигнал викликає тимчасове зниження чутливості вуха до сигналу поточного фрейму. По суті, має місце явище «» тимчасового оглушення «». Для кожного звукового діапазону визначається величина маскуючого ефекту, створюваного сигналом сусідніх діапазонів і сигналом попереднього кадру. Якщо маскуючий сигнал перевищує потужність сигналу поточного діапазону, то даний діапазон сигналу не кодується, що дозволяє психоакустичній моделі видалити частину даних з цього фрейму. Для решти даних кожного діапазону визначається, скількома битами на фрейм ми можемо пожертвувати, щоб втрати від додаткового квантування були нижче величини маскуючого ефекту. Безсумнівно, всі відзначали, що звук, кодований при низьких бітрейтах, відрізняється крайньою нечіткістю і глухістю. Це відбувається через те, що при втраті одного біта інформації в загальне звучання вноситься шум квантування величиною близько 6 dB.

Всі ці хитрощі сумарно називаються адаптивним кодуванням. Використовуючи той факт, що переважна більшість людей не володіють ідеальним слухом, технологія адаптивного кодування дозволяє істотно зменшити розмір кодованого файлу викинувши найменш значущі з точки зору слухового сприйняття деталі звучання.

Треба зауважити, що в разі низьких бітів кодування починається з адаптивного кодування. Після додаткового квантування формується підсумковий потік, який потім і стискається за алгоритмом Хаффмана (аналогічно алгоритму RAR).

Чим чудовий цей формат, так це тим, що ступінь стиснення, тобто, співвідношення розмір/якість повністю у владі користувача. Ширина потоку (bitrate) здатна змінюватися від найбільшого значення в 320kbs, до 64 kbs і нижче, відповідно варіюється і розмір.

З технологіями стиснення використовуваних в MP3 CODEC ми ознайомилися, настав час поговорити про різні бітрейти.

Якість вимагає жертв

Очевидно, що різні бітрейти навіть одного і того ж CODECa дають далеко неоднакову якість. Причому різні люди абсолютно по-різному оцінюють якість прийнятності одних і тих же бітрейтів, висловлюючи свою власну суто суб'єктивну думку. При оцінці якісності звучання часто виникає плутанина, оскільки багато хто плутає факт наявності низького або високого рівня шумів з високою або низькою якістю сигналу. Такий дуболомний підхід в принципі невірний, так як це характеристика звичайної, неком'ютерної апаратури, яку деякі хвацько за аналогією переносять на цифрове аудіо, забуваючи, що для комп'ютера це всього лише характеристика конкретного програмного MP3 плеєра. Звідси випливає, що в деяких випадках, змінивши плеєр можна істотно поліпшити якість відтворення.

Так само, чомусь багато користувачів вважають, що думка професіоналів, так би мовити «» дегустаторів «» від звуку, що володіють добре розвиненим слухом і почуттям фальші, не є авторитетною, а важлива думка середнячків зі слухом отруєним дешевою аудіоапаратурою рівня ESS. Ця думка може вплинути тільки на звання яке дають тому чи іншому CODECy - наприклад масовий «», «» народний «», «» популярний «», але при оцінці якісності кодувальника вона абсолютно недоречна.

При розробці формату MP3 його розробники найняли команду професійних звукових «» дегустаторів «», які прослухали певний набір тестових композицій закодованих з різними бітрейтами. Професіонали одноголосно вказали, що бітова біта 256kbs у більшості випадків зберігає якість звучання, яка практично не відрізняється від вихідного. І так само одностайно вказали, що вже бітрейт 192kbs досить відчутно відрізняється від оригіналу і не може претендувати на непогрішність.

Але ви повинні звернути увагу на застереження «» в більшості випадків «» яке експерти зробили для бітрейту 256kbs. У деяких випадках, особливо при кодуванні класичної музики цей бітрейт проявляє себе не кращим чином.

Якщо ви бажаєте точної відповідності стисненого файла оригіналу, скористайтеся максимальним кодуванням КД Audio бітом - 320kbs. Коефіцієнт стиснення 4:1, для біта 256 kbs - 6:1. Розмір дещо більший, зате якість сміливо можна вважати непогрішною.

Багато користувачів-меломанів вже створили собі великі фонотеки на CDR або просто на гвинті, використовуючи MP3 256kbs і 320kbs. До речі, саме в зв'язку з цим повсюдно набули величезної популярності домашні комп'ютери, оснащені приводами CD-RW (пише CD-ROM).

Але найпопулярніший на поточний момент все ж бітрейт 128 kbs, який досить швидко зайняв місце формату RA. Причина такої популярності - у відносно невеликому розмірі (стиснення 12:1), що є визначальним фактором в умовах повільної передачі даних і дорожнечі послуг провайдерів. Так само за розміром файлу MP3 легко визначити тривалість звучання. У цього бітрейту 1 хвилина звучання займає приблизно 1 мегабайт. Але якість у цього новоявленого «» мережевого короля «» на CD навіть не претендує. Це якість середньої аудіокасети. У мережі Інтернет можна в основному знайти MP3 тільки з бітом 128 kbs, MP3 з цим бітом і створювався спочатку як мережевий формат.

Шлях до перемоги: тріумф звуку

Після довгого розкачування даного формату, поступово тисячі і тисячі користувачів нарешті його оцінили. Як гриби після дощу з'явилося безліч сайтів, що спеціалізуються виключно на поширенні музики в модному форматі. Зрозуміло, практично всі MP3-файли були нелегальні або напівлегальні, оскільки до користувачів не доходило, що поширюючи куплену за свої гроші і переведену в MP3 формат музику, вони порушують закони про авторські і суміжні права. Або доходило, але... Але ось зловити і тим більше покарати нелегальних розповсюджувачів виявилося неймовірно складно. Більш того, завдяки невеликому розміру MP3 з bitrate 128 kbs виявилося можливим записати на один компакт-диск не 74 хвилини музики як раніше, а більше 650 хвилин! Цим негайно скористалися пірати. Вони почали виробляти диски типу «» всі альбоми хітової групи на одному диску «». Аудіозаписуючі компанії стали нести збитки. Навіщо купувати один альбом, якщо за ті ж гроші можна купити десять альбомів на одному CD?
Спробу побороти нелегальне поширення музики MP3 нещодавно зробив звукозаписний гігант RIAA. Але було вже пізно. MP3 індустрія досягла небаченого розмаху. Стали з'являтися апаратні міні-плеєри з пам'яттю на 32 мегабайти і можливістю підключення до комп'ютера, їх вже з'явилося понад 40 моделей. Плеєри для автомобілів на базі невеликих за обсягом (1Гб) вінчестерів. Навіть звукові карти з апаратною підтримкою MP3. З цією хвилею боротися стало неможливо. MP3 став першим визнаним форматом зберігання аудіоданих після CD-Audio. Це була перемога.

Ця музика буде вічною...

Нехай MP3 вже не найкращий. Йому на зміну йдуть нові формати: сімейство AAC (advanced audio codec), VQF, PAC (perceptual audio codec). Але він був першим. Крім того, численна аудиторія користувачів MP3 досить консервативний, MP3 вдалося глибоко вразити своїх шанувальників, тоді як його конкуренти здатні їх хіба що злегка здивувати. Так що думаю цьому стандарту уготовані ще довгі роки існування, перш ніж його змінить більш гідний.

Глосарій

MP3 (MPEG Layer3) - цифровий формат мультимедіасжатія сімейства MPEG, призначений виключно для кодування звуку. Мав попередників в особі MR1 і MR2, відрізняться високою складністю алгоритму, як наслідок високими вимогами до системних ресурсів. Найкращий у своєму класі за співвідношенням розмір/якість.
CODEC - розшифровується як COder/DECoder. Це не що інше як сукупність алгоритмів кодування і декодування звуку.
Bitrate - ширина потоку. Кількість біт, які використовуються для кодування звукового потоку. Вимірюється у kbs, тобто кількість кілобітів за секунду.
Квантування - процес видалення частот, які не сприймаються звичайним людським слуховим апаратом (вухом).
КD Audio - найстаріший формат цифрового звуку, існує більше 20 років. Параметри 44Khz, 16-bit стерео.
RA - формат, розшифровується як Real Audio. Перший формат мережі, що забезпечує передачу та відтворення звуку в реальному часі. Якщо порівнювати з MR3, то має бітів 8 і 16 kbs, і відповідно жахливу якість звуку.

Коментувати ()

Якщо Ви помітили помилку - виділіть її мишею і натисніть CTRL + ENTER.

Матеріали за темою

Акустика Edifier M3600D - спасибі Лукасу за це!

Edifier R1280DB: більше можливостей за тих самих умов

Urbanears Baggen и Stammen: скандинавський погляд на домашню акустику

Бездротова гарнітура Microlab T964BT: комфорт на кожен день

Акустика Edifier S360DB - музика високої роздільної здатності

Огляд 2 .1-акустики Microlab M-105: еталон мінімалізму