MP3 формат

Въведение

всички честоти

Като взехме предвид теоретичните ограничения на възстановяването на аналогов сигнал с добро качество (за човешкото ухо) от дискретизиран сигнал (теорема на Шанън), ние наложихме на аудио компактдисковете формат за съхранение на звук, съдържащ следните данни:
Честота на вземане на проби = 44,1 kHz
16-битови кодирани данни
Стерео звук


Това означава, че пробите, взети от музикалното произведение, което ще се дигитализира, се вземат със скорост 44,1 kHz, че са кодирани на 16 бита (т.е. 65 536 различни възможни нива) и че звукът е стерео, т.е. за дадена проба, необходимостта от съхраняване на десния и левия канал.
С този стандарт колко място отнема минута музика? ?
Имаме 44 100 проби за 1 секунда (44,1 kHz). Всяка проба е кодирана на 16 бита или 2 байта, а звукът е стерео. Следователно имаме ((44100 * 2) * 2 * 60) байта за една минута стерео музика, т.е. 10.584x10 6 байта !

Отнема около 10MB, за да съхраните минута музика.
Виждаме, че аудио сигналът, съхраняван на цифров носител, заема много място, откъдето идва и идеята да се опитаме да го компресираме и появата на MP3 стандарта.

MP3 компресия

Какво представлява техниката за компресиране на MP3 ?
Всъщност по-скоро трябва да говорим за набор от техники, използвани за достигане на крайния резултат. Сред тези техники се казва, че някои са разрушителни, други не.


Разрушителна компресия, това е компресия, която се извършва чрез загуба на информация. Това означава, че ако декомпресираме компресирания сигнал, използвайки такава техника, няма да намерим оригиналния сигнал.


Сред деструктивните техники на компресия, ние по същество имаме методи, които използват свойствата на човешкото ухо. Последният чува честоти в диапазона от 20Hz до 20kHz. Ако песента съдържа честоти извън този диапазон, следователно можем да ги изтрием чисто и просто, без да губим качеството на звука, тъй като ухото не ги чува. Всъщност правилно чуваме честотите в диапазона от 2kHz до 5kHz. Всъщност са необходими по-малко от 5dB, за да чуете честотите на тази лента, докато са необходими повече от 20dB, за да чуете честотите, разположени под 100Hz или над 10kHZ. Тези открития могат да бъдат използвани за намаляване на размера на файла. Например можем да решим, че всички честоти над 15kHz ще бъдат изтрити.


MP3 също използва принцип на честотите маскиран. Ако в група честоти някои имат много по-високо ниво на звука от други, не е необходимо да се запазват ниските честоти на нивото на звука: те няма да бъдат чути. За да използвате по-убедително сравнение, представете си, че сте във вашата градина и чувате чуруликане на птици. Съгласието преминава над главата ви (дори много високо). Вече няма да чувате птиците, защото звукът, който те издават, е много по-нисък от звука, генериран от самолета. Сякаш птиците вече не съществуват или са спрели да пеят. Виждаме, че не е необходимо да се кодират всички честоти, присъстващи в дадено парче, така че човешкото ухо да го възприеме правилно така или иначе. И накрая, ако двата канала на стерео звук представят подобни последователности, вместо да дублираме тези последователности, ние очевидно съхраняваме един и информацията, че в този момент десният и левият канал са идентични.


Сред неразрушителните техники, какво намираме ?
Основно техники за кодиране.
Нека се обясним. Звукът е честота. Следователно една секунда от музиката е поредица от честоти. Нека си представим, че в поредицата от семпли, съставляващи секунда музика (не забравяйте, че има 44 100), имаме една и съща честота няколко пъти подред, например 10 пъти. Ако вместо да съхраняваме тези 10 точки, съхраняваме само 1 и колко пъти се повтаря, трябва да кодираме 2 числа, а не 10. Ако освен това приложим този метод за честоти, които вече не са идентични, но са много близки до помежду си (толкова близо, че средното човешко ухо не може да ги различи), все пак можем да спечелим място. Този път компресията е разрушителна, тъй като заместваме една честота с друга (почти идентична).


MP3 също използва Алгоритъм на Хъфман (1952) като метод за кодиране на информация. Този метод се използва във всички алгоритми за компресиране (компресиране на текстови файлове, компресиране на изображения, компресиране на звуци). Той се основава на използването на код с променлива дължина и вероятността за възникване на събитие (в този случай на честота). Колкото по-често се появява честота, толкова по-кратък е нейният код (малък брой битове, които да я представят). Файлът се чете за първи път и се съставя таблица на появяващите се честоти и броя на появата им. Извеждаме съответния код. Това кодиране се използва последно. Това е последната фаза на компресия. Това е неразрушаващо кодиране.


MP3 работи в 1ъъъъ поставете свойствата на ухото, за да намалите размера на a парче, след това обработваме стерео аспекта и накрая прилагаме кодиране, като завършваме от Huffman кодиране.


Използването на всички споменати възможности за намаляване зависи от пространството, което искаме да дадем на 1 минута компресиран звук и следователно степента на компресия, която ще трябва да приложим.
За кодирането на звукови файлове в MP3 ние говорим повече по отношение на битрейт, отколкото на степен на компресия.
Битрейт е броят битове, разрешен за 1 секунда.
Следователно ще имаме следната връзка: колкото повече искаме да компресираме песен (така че да заема възможно най-малко място), толкова по-нисък битрейт трябва да бъде избран.


Изборът на степента на компресия (битрейт)

Очевидно е, че колкото повече компресирате, толкова по-ниско е качеството на звука.
Трябва да направим a компрометира размера на файла/качеството на звука.
Този компромис може да бъде продиктуван от вашите изисквания, но също и от използването, което искате да направите на вашите MP3 файлове. Всъщност можете да бъдете неизискващи, ако вашите MP3 файлове са предназначени за вашия Walkman и да бъдете много взискателни за слушане на Hifi система. ! Таблицата по-долу може да ви помогне да направите избор.

Имайте предвид, че сигнал, компресиран с битрейт 64 kbits/s, има честотна лента от 11 kHz (всички честоти между 11 и 20 kHz се изтриват!).
За да се получи такава степен на компресия, в допълнение към потискането на честотите, HF също се трансформира в моно сигнал, вместо да запази своя стерео характер. MP3 звукът на файлове, компресирани с битрейт от 64kbit/s, няма нищо общо с оригинала, поради което нашият съвет е да използвате такъв битрейт само за слушане на уокмен и отново.
Добър компромис е използването на битрейт от 128 kbits/s.


Можем също да добавим, че трябва да обърнем внимание и на технологията за компресиране, използвана от енкодера. Всъщност има три основни семейства кодери, които се отличават със своите алгоритми за кодиране. Има енкодери, разработени от Института Fraunhofer, енкодери, базирани на рутинни програми, разработени от Xing Technology и такива, базирани на ISO рутинни процедури. Грубо казано, можем да кажем, че Fraunhofer благоприятства качеството на компресирания сигнал, докато Xing благоприятства скоростта на своите алгоритми. За други това зависи от създателите.


В обобщение, да кажем, че ако искате MP3 файлове с добро качество музика, която може да се слуша навсякъде, дори на вашата Hifi система, използвайте битрейт 128kbits/s, ако имате кодер на Fraunhofer или базирани на ISO процедури или a 192kbits/s битрейт, ако използвате Xing енкодер.