Dźwięk i muzyka w Linuksie
www.linux-muzyka.ixion.pl

Pliki MP3 w Linuksie



MP3 (MPEG-2 Layer 3) to najpopularniejszy format kompresji stratnej.

W artykule szczegółowo opisano następujące tematy:

  • zalety i wady formatu MP3,
  • najważniejsze parametry plików MP3,
  • odtwarzacze MP3 dla Linuksa,
  • tworzenie plików MP3 w Linuksie,
  • edycja tagów.



Ostatnie kilka lat rozwoju Internetu można określić mianem ery MP3. Termin ten jest obecnie znany niemal wszystkim użytkownikom komputerów, w tym nawet osobom nie mającym styczności z Internetem.

Ten artykuł powinien pomóc w zrozumieniu, czy tak naprawdę są pliki MP3, w jakim celu są tworzone i jakie są ich zalety i wady. Druga część dokumentu to praktyczna instrukcja tworzenia plików MP3 w systemie Linux. Opiszę również narzędzia, które wykorzystamy w celu odtworzenia posiadanych plików oraz programy służące do edycji danych tekstowych zawartych w "empetrójkach".

Pliki MP3 (MPEG-2 Layer 3) przechowują skompresowane dane dźwiękowe. Aby utworzyć zbiór MP3 trzeba posiadać plik w formacie WAVE PCM. Można go uzyskać przez zrzucenie ścieżki audio z płyty CD (na przykład w programie Grip) lub nagranie dźwięku w dowolnym edytorze audio.

Wykorzystując specjalne programy (tzw. kodery), możemy skompresować plik WAVE do formatu MP3. Zakodowane dane zajmują 8 - 12 razy mniej miejsca na dysku niż pliki źródłowe (*.wav).

Stosunkowo niewielka objętość "empetrójek" powoduje, że mogą być one przesyłane przez sieci komputerowe i rozpowszechniane w Internecie. W tym tkwi siła formatu MPEG-2 Layer 3.

Zalety i wady formatu MP3

Opisując zalety plików MP3 nie można pominąć wad, jakimi obarczony jest ten format. Najpoważniejsze mankamenty to:

Najpoważniejszą wadą technologii MP3 są ograniczenia licencyjne. Opatentowanie algorytmów powoduje, że niemożliwe jest tworzenie oprogramowania kodującego pliki MP3 bez uprzedniego uiszczenia opłaty licencyjnej.

Jedynym sposobem ominięcia ograniczeń patentowych jest stworzenie alternatywnych formatów kompresji i udostępnienie ich na zasadach wolnego oprogramowania. Takim algorytmem jest OGG - format plików dźwiękowych zbliżony do standardu MP3.

Pliki OGG bardzo powoli zdobywają swoich zwolenników. Istnieją już strony internetowe, z których można pobrać legalne i pozbawione ograniczeń licencyjnych pliki OGG. Nowy format kompresji dźwięku nie zdetronizuje zapewne "empetrójek", choć jest tego wart - pliki OGG zapewniają nieco lepszą jakość, przy czym są mniejsze od analogicznych plików MP3.

Kolejnym minusem technologii MP3 jest przeciętna jakość brzmienia skompresowanych danych dźwiękowych. Na ten problem nie ma antidotum. Każdy algorytm kompresji stratnej powoduje nieodwracalną utratę jakości kodowanego materiału. Aby uniknąć pogorszenia jakości należałoby stosować bezstratną kompresję - otrzymane w tym przypadku pliki są jednak jedynie 2 razy mniejsze od źródłowych. Algorytmy kompresji bezstratnej nie nadają się zatem do tworzenia plików przesyłanych przez sieci i Internet.

Pamiętać należy, że odpowiednie przygotowanie materiału dźwiękowego i kontrola procesu kodowania pozwolą nam na uzyskanie plików MP3 naprawdę wysokiej jakości. Większość ludzi nie jest w stanie usłyszeć różnicy pomiędzy dobrze przygotowanymi plikami MP3 a nagraniami z płyt CD.

Poważny problem stanowi pojawienie się setek witryn internetowych rozprowadzających nielegalnie pliki MP3. Z drugiej strony istnieją serwisy zawierające legalną muzykę zespołów, których nagrań nie zechciała wydać żadna wytwórnia płytowa. Również wielu wykonawców muzyki komercyjnej udostępnia legalne próbki swoich utworów - pozwalają one zorientować się w zawartości płyt i, ewentualnie, podjąć decyzję o ich zakupie.

Parametry plików MP3

Po ogólnym opisie zalet i wad formatu MP3 przejdę do bardziej szczegółowej charakterystyki zawartości plików MP3. Wiedza o parametrach dźwięku zapisanego w skompresowanych zbiorach pozwoli nam na pełniejszą kontrolę procesu kodowania i, w efekcie, na uzyskanie dobrze brzmiących plików MP3.

Przed rozpoczęciem kompresji warto zwrócić uwagę na jakość materiału źródłowego. Nigdy nie kodujmy nagrań słabej jakości, zaszumionych i przesterowanych. Niemożliwe jest uzyskanie dobrych plików MP3 z fatalnych zbiorów WAVE.

Aby skompresować dane audio do formatu MP3 konieczny będzie specjalny program - koder. Opis konkretnego oprogramowania dla systemu Linux znajduje się w dalszej części artykułu - tutaj chciałbym opisać podstawowe parametry, które będziemy musieli określić podczas pracy z koderiem.

Kluczowym parametrem plików MP3 jest bitrate - przepływność (lub częstotliwość bitowa). To od niej w głównej mierze zależy jakość skompresowanego dźwięku. Im wyższa przepływność, tym lepsze będzie brzmienie. Minimalną stosowaną wartością przepływności powinno być 128 kbps - takie jest zresztą domyślne ustawienie wielu programów kodujących.

W niektórych przypadkach można kodować dźwięk z przepływnością mniejszą niż 128 kbps. Tak jest w przypadku odtwarzaczy przenośnych - małe słuchawki i tak z reguły nie są w stanie wygenerować dźwięku dobrej jakości. Mowę ludzką również można kompresować przy niskiej przepływności.

Sporządzając pliki MP3 o niskich wartościach bitrate zauważyć można wyraźny spadek jakości. Objawia się on przycinaniem wyższych częstotliwości (kilkunastu kHz), w efekcie czego usuwane są składowe harmoniczne kompresowanego dźwięku. Brzmienia stają się płaskie i bezbarwne, czasami nabierają "mechanicznego" pogłosu. Najlepiej jest wtedy powtórzyć kodowanie z wyższą przepływnością. Ewentualne braki i usterki staną się wtedy niesłyszalne dla mniej wyćwiczonego ucha.

Zwiększenie przepływności powoduje automatyczny wzrost objętości pliku MP3. Stąd też tak ważne jest ustalenie odpowiedniej proporcji pomiędzy wielkością pliku a parametrem bitrate. W wypadku zastosowania przepływności 128 kbps wynikowy plik MP3 jest 12 razy mniejszy od źródłowych danych WAVE.

W przypadku nagrań o zróżnicowanej dynamice oraz takich, w których ciche fragmenty przeplatają się z głośniejszymi, warto zastosować kodowanie VBR (Variable BitRate). Program kodujący samodzielnie wybiera wtedy odpowiednią przepływność, przy czym ulega ona częstym zmianom w czasie trwania utworu. Zastosowanie tej techniki pozwala uzyskać pliki MP3 o lepszej jakości i mniejszej objętości.

Kolejnym ważnym parametrem jest sposób kodowania danych stereofonicznych. Pliki MP3 mogą być:

Wybranie trzeciej z wymienionych możliwości spowoduje, że wyjściowy plik MP3 będzie zawierał część monofoniczną (wspólną dla obu kanałów) oraz stereofoniczną (kodującą różnice między kanałami).

Tryb joint stereo pozwala na zmniejszenie objętości plików MP3 - jak zwykle kosztem jakości. W przypadku materiałów prezentowanych w Internecie opcja joint stereo jest jednak rozsądnym wyborem.

Odtwarzanie plików MP3 w Linuksie

Przed rozpoczęciem tworzenia plików MP3 warto jeszcze zaopatrzyć się w narzędzia służące do ich odtwarzania. Nie stanowi to problemu. Dostępne jest co najmniej kilkanaście programów działających pod Linuksem i obsługujących format MP3. Niektóre z nich są samodzielnymi aplikacjami, z kolei inne to nakładki na odtwarzacze MP3.

Najważniejsze odtwarzacze MP3 dla Linuksa to:

i wiele innych.

Większość z wymienionych wyżej programów radzi sobie również z innymi formatami danych audio. Nierzadko odtwarzacze te są wzorowane na WinAmpie. Obsługują wtedy mechanizm wtyczek i skór, playlisty oraz efekty specjalne. Wybór jest naprawdę imponujący, a instalacja tych programów nie stanowi problemu. W tym aspekcie Linux nie ustępuje "okienkom" Microsoftu ani innym systemom operacyjnym.

Interfejs odtwarzacza MPlayer.

Interfejs odtwarzacza MPlayer. Zobacz powiększenie.

Tworzenie plików MP3 w Linuksie

Teraz przejdziemy do czynności czysto praktycznych - tworzenia własnych plików MP3. Sprawa jest bardzo prosta. Z reguły wystarczy uruchomić ulubiony edytor audio, otworzyć plik WAVE i zapisać go jako zbiór MP3.

Edytory dźwięku korzystają jednak z zewnętrznych bibliotek i koderów obsługiwanych z linii poleceń. Dlatego uważam, że warto poznać jedno z takich narzędzi, by potem bezproblemowo i z pełnym zrozumieniem tworzyć pliki MP3 dobrej jakości z poziomu edytora audio.

Najlepszym koderem MP3 dla Linuksa jest niewątpliwie program LAME (LAME Ain't an MP3 Encoder). Aplikacja nie posiada graficznego interfejsu - obsługiwana jest z linii poleceń. W tym rozdziale przedstawię najważniejsze parametry programu, które zastosujemy w celu utworzenia własnych plików MP3.

Aby uzyskać zakodowane dane, wystarczy wpisać:

lame plik.wav plik.mp3

Oczywiście nie uzyskamy w ten sposób odpowiedniego rezultatu. Aby nasze nagranie brzmiało rzeczywiście dobrze, będziemy musieli zastosować szereg parametrów.

Na początku ustalmy tryb kodowania plików stereo. Wybieramy go za pośrednictwem parametru -m, po którym wpisujemy wybraną literę:

Jeżeli wybraliśmy tryb joint stereo, to powinniśmy wydać polecenie:

lame -m j plik.wav plik.mp3

W wypadku wybrania innego trybu należy odpowiednio zastąpić literę j.

Drugi istotny parametr to przepływność. Możemy wybrać następujące możliwości:

Opiszę teraz pierwszą i trzecią możliwość.

Aby program kompresował zbiór WAVE ze stałą przepływnością, należy wpisać parametr -b, a po nim wybraną wartość przepływności. Standardowo jest to 128 kbps:

lame -b 128 plik.wav plik.mp3

Wyższe wartości tego parametru gwarantują lepsze brzmienie zakodowanego dźwięku. Niestety, spowoduje to również zwiększenie objętości wynikowego pliku MP3.

Druga możliwość to wybór przepływności VBR. O zaletach trybu pisałem we wcześniejszej części artykułu, tutaj przedstawię tylko potrzebne parametry.

Użycie zmiennej przepływności kodowania wymuszamy parametrem -v. Możliwe jest również zastosowanie polecenia -V, po którym wpisujemy cyfrę określającą jakość kodowania VBR (0 - największa, 9 - najmniejsza):

lame -V 4 plik.wav plik.mp3

Po wybraniu trybu VBR koder będzie zmieniał wartość przepływności według własnego uznania. Możemy jednak zdefiniować minimalną (-b) i maksymalną (-B) dopuszczalną wartość przepływności:

lame -V 4 -b 64 -B 160

Oprócz wymienionych wyżej parametrów, które posiadają największy wpływ na jakość pliku MP3, możliwe jest jeszcze określenie dodatkowych opcji. Jedną z nich jest jakość zastosowanych algorytmów:

lame -q liczba plik.wav plik.mp3

gdzie liczba mieści się w zakresie od 0 (bardzo powolne kodowanie) do 9 (szybka kompresja, słaba jakość).

W większości przypadków wystarcza wartość stosowana domyślnie:

lame -q 5 plik.wav plik.mp3

Jeżeli posiadasz szybszy komputer, możesz wybrać poziom 2:

lame -q 2 plik.wav plik.mp3

co da bardzo dobrą jakość bez wyraźnego spowolnienia pracy kodera.

To właściwie wszystkie najważniejsze parametry. Czasami warto jeszcze dopisać parametry wejściowego pliku - zwłaszcza gdy jest on zapisany w formacie raw, czyli bez nagłówków:

lame -bitwidth 16 -s 44.1 plik.wav plik.mp3

Powyższa linia poleceń informuje LAME, że wejściowy plik nagrany został z jakością płyty CD (44100Hz, 16 bitów).

Jako podsumowanie części artykułu poświęconej koderowi LAME chciałbym przedstawić przykład łączący wszystkie opisane przeze mnie parametry. Polecenie:

lame -bitwidth 16 -s 44.1 -m j -V 4 -b 64 -B 160 -q 2 plik.wav plik.mp3

po skorygowaniu wartości poszczególnych parametrów powinno dać nam dobrze brzmiący plik MP3.

Z pewnością niejeden użytkownik komputera odczuwa niechęć do wpisywania długich poleceń w trybie tekstowym, a do tego zmusza nas program LAME. Można jednak skorzystać z dowolnego edytora audio, który udostępnia możliwość zapisu plików MP3 (na przykład Audacity). Wadą tego rozwiązania jest jedynie to, że z reguły nie uzyskamy dostępu do bardziej zaawansowanych ustawień kodera.

Aby utworzyć plik MP3 w programie Audacity, wystarczy wybrać z menu Plik polecenie Export As MP3.... To wszystko. Po chwili (dłuższej lub krótszej) otrzymamy gotowy zbiór MP3.

Edytor Audacity nie tworzy samodzielnie plików MP3, ale korzysta z bibliotek LAME. Aby poprawnie skonfigurować kodera, musimy otworzyć okno preferencji programu (kombinacją klawiszy Ctrl+P). Następnie wybieramy zakładkę Formaty pliku.

Jeżeli w sekcji Ustawienia eksportu dla MP3 zobaczymy komunikat, że biblioteka LAME nie została znaleziona, to naciskamy klawisz Znajdź bibliotekę. Potrzebny plik (libmp3lame.so) znajduje się zapewne w katalogu /usr/lib lub /usr/local/lib.

Konfiguracja edytora Audacity.

Konfiguracja edytora Audacity. Można tutaj określić przepływność zapisywanych plików MP3. Zobacz powiększenie.

Jedynym parametrem kodera, który zmienić możemy z poziomu programu Audacity, jest przepływność (Częstotliwość bitowa). Kto wie, może mimo wszystko docenimy tekstowy, dający dostęp do wszystkich opcji, interfejs programu LAME.

Edytory tagów MP3

Na pewno zorientowaliśmy się już, że pliki MP3 nierzadko przechowują informacje o tytule nagrania, wykonawcy, albumie, roku wydania i stylu muzycznym. Te dane to tak zwane tagi.

Tworząc własny plik MP3 będziemy zapewne chcieli go opisać - nadawanie długiej nazwy nie jest zalecane, gdyż niektóre systemy plików mogą "zgubić" zapisane w ten sposób dane. Zdarza się to niekiedy przy przenoszeniu plików na komputery DOS & Windows. Najlepszym rozwiązaniem będzie zastosowanie tagów.

Informacje o nagraniu mogą być wpisane za pośrednictwem programu LAME. Wystarczy podczas kodowania pliku dodać następujące parametry:

lame --tt Tytuł --ta Wykonawca --tl Płyta --ty 2004 --tc Komentarz [pozostałe parametry kodera]

Opisane przeze mnie parametry to nie wszystkie możliwe do zdefiniowania tagi.

Tym razem nie będę zachęcał do korzystania z programu LAME. Ze względu na konieczność żmudnego wpisywania z linii poleceń kolejnych tagów nie okaże się on zapewne przydatny. Na szczęście możemy skorzystać z co najmniej kilku edytorów tagów działających w trybie graficznym.

Najlepszym - moim zdaniem - tego typu programem jest EasyTAG. Skanuje on drzewo katalogów, poszukując plików MP3 i OGG. Znalezione zbiory mogą być automatycznie opisane - na podstawie nazw plików lub zdefiniowanych wzorców. Korzystanie z edytora EasyTAG jest szybkie i przyjemne. Dzięki niemu można opisać nawet ogromne kolekcje plików MP3.

Interfejs programu EasyTAG.

Interfejs programu EasyTAG. Zobacz powiększenie.

Mam nadzieję, że przedstawiłem wszystkie najważniejsze aspekty pracy z plikami MP3. Będę zadowolony, jeżeli artykuł zachęcił Ciebie do podjęcia trudu tworzenia własnych plików MP3. Jeśli jesteś muzykiem - amatorem, to masz możliwość nieodpłatnego umieszczenia swoich kompozycji na przeznaczonych do tego stronach internetowych. Warunkiem jest tylko przygotowanie i przesłanie plików MP3 ze swoimi kompozycjami.



07.02.2004


Zobacz więcej na tej witrynie

Komentarze

+ Dodaj własny komentarz

Twórca witryny nie ponosi odpowiedzialności za treść zamieszczonych komentarzy.


Inne strony w Internecie




SZUKAJ


SPONSOR


SEKCJE

Strona główna

• Programy

• Sprzęt i sterowniki

• Artykuły

• Blog

• Forum

• Linki

• Mapa serwisu

• Kontakt

• Przyjaciele