Halihazırda elimizin altında olan bunca ses formatı hayatta ne işimize yarar?Bu formatlar hakkında ne kadar detay bilmek durumundayız?Bir otomobili sadece kullanmak ile ABS fren sisteminin ya da elektronik yol bilgisayarının ne işe yaradığını bilmek arasındaki ayırım ile aynı.Belirleyici unsurların başında ''ihtiyaç'' ve ''amaç'' geliyor.
Standart kullanıcıların dijital ses formatları ile ''en yaygın ve yakın'' ilişkisi,internetten müzik indirmek ve bunları bilgisayar ya da taşınabilir cihazlarda dinlemek.Bununla beraber cep telefonları ve dijital TV yayınlarıda dahil bir çok alanda kullanılan bir araçtır dijital ses.Dijital ses ile ilgili bilmemiz gereken en temel konu dijital sesin aslında bir ''veri'' olduğu ve bu verinin işlenmesinde kullanılan tekniklere bağlı olarak ortaya ''format'' dediğimiz dosya türlerinin çıktığı.Örneğin PC'lerde kullanılan ''Wav'' ya da Apple bilgisayarlarının kullandığı ''AIFF'' ses dosyaları birer format ancak her ikiside codec olarak PCM algoritmasını kullanıyor.
Dijital ses formatlarını temel olarak üç ana kategori altında incelemek mümkün, bunlar;''sıkıştırılmamış Formatlar''.''Kayıpsız Sıkıştırılmış Formatlar'' ve ''Kayıplı Sıkıştırılmış Formatlar''.Bu formatların birbirine ''dönüştürülebilir'' olması,kullanıcılar açısından büyük bir avantaj.Bir başka önemli nokta sa pek çok donanım/cihazın pek çok formatı bir arada destekleyebilmesi.
Sıkıştırılmamış Formatlar
Wav
Yaklaşık 20 yıl önce Microsoft ve IBM tarafından geliştirilen ve günümüzde Windows temelli tüm bilgisayarların ''sesi'' için ''de-facto'' standart olan formattır.Wav formatı PCM (Pulse Code Modulation) algoritmasını kullanır ve sıkıştırılmamıştır.Bu nedenle CD'de yer alan dijital ses formatına (CDDA) en yakın formattır ve dijital ses kayıt yazılımlarının hepsinde standarttır.
Wav formatlı dosyalar oldukça büyük bir veri alanı kaplar.(ortalama 10MB/dakika).Diğer yandan bu formatın da kendi içinde ADPCM,u-LAW gibi codec'ler kullanılarak sıkıştırılması mümkün.Ancak wav formatı hakkında bilmemiz gereken temel konu;sıkıştırılmamış ve CD'deki dijital ses en yakın format olduğudur.
CDA(ya da CDDA)
Djital sesin ilk türü ya da atası diyebileceğimiz CDDA(Compact Disc Digital Audio) 1979'da Sony ve Philips'in Compact Disc'i icadıyla ortaya çıkan bir format ve aslında CD'deki dijital ses verisini ifade ediyor.Bilgisayarınıza bir ses CD'si koyduğunuzda dosya menüsünde parçaların ''.cda'' uzantılı görünmesinin anlamı bu.Bu format daha çok CD/DVD çalarlarda yaygın olarak kullanılır.CD'nizi orjinal ses kalitesi ile bilgisayarınıza aktarmak istediğinizde bu formatı wav formatına çevirmeniz gerekir.Bu noktada genel kanıya bağlı olası bir yanlış bilgiyide düzeltmeye çalışalım;CD'deki cda uzantılı dosya ile aynı dosyanın bilgisayarınızdaki wav uzantılı biçimi dijital ses kriterleri açısından yakın olsada teknik olarak farklılıklar içerir.
AIFF ve AU
Macintosh bilgisayar kullanıcılarının ismen aşina olduğu AIFF formatının temel olarak Windows'taki Wav formatından hiç bir farkı yok.AIFF de sıkıştırmasız bir format ve algoritma (codec) olarak PCM 'yi kullanıyor.
AU ise SUN/Next işletim sistemlerine sahip bilgisayarlarda kullanılan bir ses formatı ve yine wav yada AIFF gibi sıkıştırmasız (dolayısıyla kayıpsız) bir dijital ses formatı.Bu arada her iki dosya formatınında Windows temelli sistemlerle uyumlu olduğunu ekleyelim.
PCM
Türkçe'ye akım ''darbelerinin kodlanması ve modülasyonu'' şeklinde çevirebileceğimiz Pulse Code Modulation kelimelerinden türetilmiştir.Bu teknik,bir anlamda dijital sesin atasıdır.Temelde elektrik sinyalinin işlenmesi ile ilgili olan bu yöntem 1930'lardan beri bilinmekteydi ancak analog sesin dijitale çevrilmesinde kullanılabileceğinin keşfi 1970'lere rastlar.
Bu algoritmayı sıkıştırılmamış dijital sesin kayıt-saklama-iletimi için temel yöntem olarak tanımlayabiliriz.Esas olarak verinin 1 ve 0'dan oluşan ikili bir kodlama sistemi ile temsil edilmesine dayalıdır.Kod içinde yer alan her ''1'' ,akım var (pozitif voltaj) her ''0'' ise akım yok anlamına gelir.Bu codec ,8 ile 192 kHz örneklem oranları ve her bir örnek için de 8 ile 24 bit veri uzunluğunda çalışabilir.(Yani analog sesten saniyede en az 8 bin en çok 192 bin adet örnek alınabilir ve bu örneklerin her birinin uzunluğu en az 8 bit en çok 24 bit olabilir.
PCM tekniği '' binanın temeli'' olduğu için tüm işletim sistemleriyle ve neredeyse tüm dijital ses yazılım/donanımlarıyla uyumludur.Bu algoritma Wav ,AIFF,CDDA(CD formatı) gibi sıkıştırılmamış formatlar ve profesyonel dünyada kullanılan DAT'ta (Dijital Audio Tape) kullanılır.
Sıkıştırılmış Formatlar
Sıkıştırılmış formatlar kendi içinde ''kayıplı'' ve ''kayıpsız'' olmak üzere ikiye ayrılıyor.
MP3(MPEG-1 Layer III ya da MPEG Audio Layer III)>kayıplı<
CD'nin 1980'lerde yarattığı etki ve başlattığı dönüşüm ne ise mp3 formatının 1990'ların sonunda yarattığı etki için de aynı şeyi söylemek mümkün.
1987 yılında dijital ses yayıncılığı ile ilgili araştırmaları içeren EUREKA EU147 projesi kapsamında geliştirilen mp3,birçoğumuzun sandığının aksine ''bedava'' değil ,patentli bir teknoloji.Fraunhofer IIS tarafından geliştirilen bu ses sıkıştırma algoritmasının temel patent hakları bugün Fraunhofer Enstitüsü ve Thomson'un elinde bulunuyor.Formatın kendisi ücretsiz ancak bir mp3 çalar üreticisi cihazlarında bu codec'i kullanabilmek için lisans bedeli ödemek zorunda.
1992'sw standardı kabul edilen mp3'ün tüm dünyada bir ''çılgınlık'' boyutuna ulaşmasında en büyük ''tetikleyici'' internet üzerinden dosya paylaşımına olanak veren napster adlı program oldu.Fakat sonradan olacaklardan kimse heberdar değildi.Format, bugün dünyanın en yaygın ''sıkıştırılmış ses formatı'' konumunda.Bundaki en önemli etken CD'deki standart bir müzik parçasının dosya boyutunun 10-14 kat arasında ''küçültülebilmesi'',böylece herhangi bir dijital kayıt ortamına (CD,flash bellek,mp3 çalar vb.) daha çok parça sığdırılabilmesi.Bu etkene ,boyut küçüldüğü için sanal alemde dosya transferinin çok daha kısa zaman almasını da eklemek gerek.
CD'den mp3'e çevrimde izlenilecek en kısa ve kaliteli yol parçayı dijital olarak okuyup hemen mp3'e çevirme ile olur.Bunu yapabilen ''CD Ripper'' adlı programlar vardır.Bu programlar sesi dijital okumayı destekleyebilen CD-ROM sürücülerden parçayı track olarak okur ve kendi içinde bulunan mp3 encoder ile hemen mp3'e çevirir.
Bu format hakkında bilinmesi gereken temel konu;sıkıştırma oranını yükselttikçe dosya boyutunun küçüleceği ancak sesin kalitesinden taviz verileceğidir.Bu nedenle sıkıştırma oranını mp3'ü kullanım amacınıza göre belirlemeniz yerinde olacaktır.
mp3PRO >kayıplı<
2001 yılında lanse edilen ve o tarihten bu yana mp3 uygulamalarında giderek yaygınlaşan ''mp3 pro'' , adından da anlaşılacaği üzere mp3'ün yeni nesli.Yine Fraunhofer Institute ve Thomson multimedia tarafından geliştirilen bu format,standart mp3 ile aynı ses kalitesini çok daha küçük dosya boyutu ile yakalayabiliyor.
Standart mp3'e göre daha küçük dosya boyutu,özellikle yüksek frekanslara uygulanan bir sıkıştırma tekniği ile mümkün olmuş.SBR(Spectral Band Replication/Dalga Boyu Yenilemesi/Çoğaltımı) adı verilen bu teknik ile kayıpsız sıkıştırmaya yakın bir sonuç elde edildiği idda ediliyor.
Gidişat gösteriyor ki mp3PRO bir süre sonra tamamen mp3'ün yerini alacak.Bu formatın bir avantajı da geriye dönük uyumluluk.Yani bu formatta sıkıştırılmış bir dosya eski mp3 çalarlarda standart bir mp3 olarak okunabiliyor.
WMA-Windows Media Audio>kayıplı-kayıpsız<
Windows'un ''gidişatı'' görüp mp3'e cevap olarak geliştirdiği bu formatın mp3'e göre iki temel farkından/avantajından söz etmek mümkün.İlki,aynı ses kalitesini daha düşük veri oranları ile sunabilmesi(128kbps mp3=64kbps WMA gibi)Wma formatı mp3'e nazaran daha hızlı sıkıştırma sağlar.Bu formatta yer alan ''kopyalama engelleme''özelliği ise formatın çıkışını takriben endüstrinin birçok oyuncusu tarafından tercih edilmesinde önemli bir etken oldu.2000'den sonraki tüm Windows işletim sistemlerinde yer alan Windows Medya Çalar yazılımına entegre edilmiş olarak kullanılabilen bu format,internet üzerinden duraksız veri akışına da (streaming) olanak sağlıyor.Format hem kayıplı hemde kayıpsız sıkıştırma olanağı sağlıyor.
AAC-Advanced Audio Coding>kayıplı<
AAC (Advanced Audio Coding-Gelişmiş Ses Kodlaması) için dijital ses dünyasının ''yükselen değeri'' seklinde bir tanımlama yapmak yanlış olmaz.Herşeyden önce formatın arkasında bu işin '' babaları'' Dolby Laboratuarları,Fraunhofer Enstitüsü,AT&T ,Sony ve Nokia var ve mevcut ses formatlarının hiçbiri için bu kadar lider marka bir araya gelmiş değil. Bir başka nokta ise ;AAC'nin başta dijital radyo ve TV yayınları olmak üzere şimdiden dijital sesin kullanıldığı bir çok alan/uygulamada standart kabul edilmiş olması.(DVB-T HD-TV)
Aslına bakarsanız AAC pek o kadar ''yeni'' sayılabilecek bir format da değil!Bu alandaki standartları belirleyen MPEG grubu,MPEG-2 standardının bir parçası olan AAC formatını Nisan 1997'de açıkladı.Ancak neredeyse hergün yeni bir formatın ortaya çıkması ve ''aralarındaki koltuk kapma yarışı''AAC'nin yaygınlaşmasını biraz geciktirdi.
Format asıl çıkışını ''iPod çılgınlığı'' ve internetin ilk ve en organize ücretli parça indirme yazılımı ''itunes'' ile yaptı diyebiliriz.iTunes üzerinden satışı yapılan parçaların tamamı AAC formatında.Mp3'ün dünya çapında yarattığı etki inkar edilemez ancak hiçbirimizin yadsıyamayacağı insani bir durum da var,''daha fazlasını istiyoruz!''


AAC'nin diğer formatlarla arasındaki en önemli teknik farklardan biri ise formatın herbiri tam frekans bandında 48 kanalı destekleyebilmesi.Bu özellik çok kanallı ses uygulamalarının DVD dışında da kullanılabilmesi için geniş olanaklar sunuyor.Bir diğer artı değer de örnekleme oranının(sampling rate)96 kHz'e kadar çıkabilmesi.Bu oran mp3 ile kullanılabilecek örnekleme oranının neredeyse iki katı.
AAC bugün ''sıkıştırılmış'' dijital ses formatının en son nesli olan MPEG-4 standardının da çekirdeğini teşkil ediyor.
Vorbis(OGG Vorbis)>kayıplı<
Bu formatın ''hikayesinden'' kısaca bahsetmek gerek önce.Format,kar amacı gütmeyen ve internet medyasının serbest kullanımı için çalışan kurum ve vakıfların (ve üretimlerinin) özel girişimcilerce ticari amaçlarla kontrol edilmesini engellemek üzere kurulmuş ''Xiph.Org'' adlı oluşum tarafından geliştirilmiş.Vakfın amacı ücretsiz ve açık kaynak kodlu yazılımlar ve sistemler geliştirerek ya da geliştirilmesini destekleyerek bunları herkesin kullanımına sunmak.Doğal olarak da OGG Vorbis'in en belirgin özelliği başından beri ''açık kaynak kodlı'' ,yani herkesin kullanım ve geliştirilmesine açık oluşu.
İsimdeki ''OGG'' ses,görüntü ve yazılı veri içeriğini bir arada barındıran ''taşıyıcı dosya'' türü/formatı.(Yani ses ve görüntünün bir arada olduğu AVI ya da Mov dosyaları gibi).Vorbis ise bu taşıyıcı içindeki dijital ses dosyasının formatı.Yani alışılageldiği üzere formatın adı OGG değil Vorbis aslında(uzantısı .ogg).
Vorbis formatı üzerindeki çalışmalar 1993'te başladı.Formatın ''açık kaynak kodlu'' oluşu dolayısıyla bir patente dayanmaması,yayılmasınıda hızladırdı.Format sürekli geliştirlmekte olduğu için her yeni versiyon bir öncekine göre daha iyi bir ses kalitesi ve artı özellikle taşımakta.Her yeni versiyonun geriye dönük uyumluluğuda bulunuyor.Anti-mobil kulaklık kullanıcıları Vorbis'in mp3'e göre daha az tırmaşıksız tizler verdiğini söylerler.Vorbis 8 kHz'den 48 kHz'e kadar örnekleme oranı(16 bit) ile her kanal için 16-128 kbps arasında bir oranı değerlerine sahip.Mp3'te olduğu gibi CBR (sabit veri oranı) hemde VBR (değişken veri oranı) ile kodlamaya elverişli.Formatın bir başka özelliği ise çok kanallı kodlanabilen bir kaç formattan biri oluşu.Belli başlı rakipleri gibi internet üzerinden duraksız veri akışına (streaming) uygun olan format,yazılım temelli müzik çalarlar,dolayısıyla bilgisayarlar harici donanımlarda da kendisine yer edinmeye çalışıyor.
ATRAC (Adaptive Transform Acoustic Coding)
1992'de Sony'nin Mini Disc'i (MD) dünyaya lanse etmesiyle birlikte dijital ses dünyasına giren ,dolayısıyla da ses sıkıştırma Codecleri'nin en eskilerinden birisi diyebileceğimiz bir format.MD'nin tüketici elektroniğinde beklendiği gibi tutunamamaması MD'nin ardındaki asıl teknoloji olan bu formatı gölgede kalmasına sebep oldu.
Sony bu formatı oldukça geliştirip MD'nin dışındaki ortam/cihazlarda da kullanıma açtı.Örneğin 1999 yılında internet üzerinden dijital müzik dağıtımı amacıyla kuruln ''bitmusic'' sitesinde dosyalar bu formatta idi.Marka,MD çalarlar dışında hafıza kartlı taşınabilir cihazlarına da bu teknolojiyi adapte ettiysede bugün ATRAC,neredeyse sadece Sony markalı cihazlar/yazılımlar ile anılır durumda.
Format ilk geliştirilmesinden sonra iki kez revizyondan geçerek ''ATRAC'' ve ''ATRAC3 Plus'' adlarını aldı,günümüzdeki en gelişmiş versiyonu ise ''ATRAC Advanced Lossless'' adını taşıyor.Formatın diğer Codec'lerden önemli bir farkı orjinal ses verisini önce frekans bandlarına ayırması ve her bir banda ayrı ayrı sıkıştırma uygulaması.
Apple Quick Time>kayıplı<
Başlangıçta Apple bilgisayarlarının standart multimedya formatı olan by format zaman içerisinde özellikle internet temelli entegre görüntü/ses uygulamalarının standardı haline geldi.QuickTime,internet üzerinden duraksız veri aktarımı için de oldukça yaygın biçimde kullanılıyor..mov uzantısından aşina olacağınız bu dosya formatı ,OGG'de olduğu gibi aslında görüntü ,ses,yazı gibi farklı veri türlerini bir arada barındıran bir taşıyıcı dosya formatı.
RealAudio Media>kayıplı<
Aslen internet üzerinde gerçek zamanlı duraksız veri akışı için kullanılan format.Patenti Real Metwokse aittir.
FLAC>kayıpsız<
Free Lossless Audio Codec (Ücretsiz Kayıpsız Ses Kodlama/Açma Algoritması),adından anlaşılacağı üzere,bir başka ''patentsiz '' dolayısıyla herkesin serbestçe kullanımına açık dijital ses formatı.
Kayıpsız sıkıştırma tekniğini kullanan format ,kayıplı formatlara nazaran daha büyük dosya ''ölçülerine'' sahip haliye.Teorik karşılaştırmalarda diğer kayıpsız sıkıştırma formatları ile kıyaslandığında ses kalitesi yönünden henüz pek tatminkar sonuç vermesede, ücretsiz ve açık kaynak kodlu oluşu Vorbis'te olduğu gibi sanal alemde hızla yayılmasına hatta birçok tüketici elektroniği markasınında formatı cihazlarına dahil etmesine yol açtı.
Apple Lossless Audio Codec>kayıpsız<
Patenti Apple'a ait kayıpsız sıkıştırma formatı.
Monkey's Audio (MAC)>kayıpsız<
Yine son dönemlerde ortaya çıkan bir başka kayıpsız sıkıştırma algoritması.Adının ''Maymun'un Ses Sinyali'' anlamına gelmesindeki ''espriyi'' bir kenara bırakırsak format oldukça hızlı çevrim özelliği ile dikkat çekiyor.Kısaca MAC olarak da anılan formatın temeli;kayıpsız sıkıştırmaya dayalı olduğu için sıkıştırma oranı 1.5:1 ile 3:1 arasında değişiyor.
WavPack>kayıplı-kayıpsız<
WavPack kıyıda köşede kalmış ancak ilk lansmanı 1998'de yapılan dolayısıyla ''eski'' sayılabilecek bir başka dijital ses sıkıştırma algoritması.WMA formatı gibi hem kayıplı hemde kayıpsız modda kullanılabiliyor.Ancak WMA'dan ayrılaniki özelliği ''açık kaynak kodlu '' yani ücretsiz oluşu ve ''hybrid(tümleşik) mod'' adı verilen türü.
Hybrid mod'da kayıpsız sıkıştırmanın avantajları ''extra'' bir özellikle biraraya getirilmiş .Bu moddaki sıkıştırma işlemi sırasında tek bir dosya yerine iki ayrı dosya yaratılıyor.Dosyalardan biri orjinal ses verisinin ''kayıplı olarak'' sıkıştırıldığı dosya .Tek başına da kullanılabilen bu dosyanın boyutu orjinale göre bir hayli küçük doğal olarak .İkinci dosya ise ''kayıplı sıkıştırılmış dosya '' ile birlikte kullanılabilen ve kayıpsız sıkıştırma kodlarını içeren dosya.Bu iki dosya birleştirildiğinde kayıpsız sıkıştırılmış dosyanız oluyor.Yani bir anlamda orjinal ses dosyasını ikiye ayırıyorsunuz.İlk dosya ses verisinin içindeki gereksiz bölümlerin(duyulamayacak frekansların örneğin) çıkartılmış hali ve tek başınada kullanılabiliyor.İkinci dosya ise ''ilk dosyadan çıkarttığınız'' bölümler.İkisini bir araya getirdiğinizde hem sıkıştırılmış hem de orjinal ses verisinden eksiltme yapılmamış bir dosyaya sahip oluyorsunuz.Bu yaklaşımın en büyük avantajı kullanıcıyı sıkıştırma işlemini kayıplımı kayıpsızmı yapayım kararsızlığından kurtarması.
Kaynaklar
http://www.wavpack.com
http://www.monkeysaudio.com
http://www.dolby.com
http://www.is.fraunhofer.de