در سالهای اخیر، تکنولوژیهای صوتی توجه زیادی را به خود جلب کرده است. این تکنولوژیها از صدای آنالوگ به صدای دیجیتال تغییر کردهاند و فرمتهای صوتی مختلفی را به وجود آورده اند. صدای آنالوگ، صداها را بدون تغییرات دیجیتالی ضبط و پخش میکند. صوت دیجیتال، امواج صوتی را به دادههای دیجیتال تبدیل میکند که به کاربران امکان میدهد تا صدا را به شکل دقیقتری ضبط، ویرایش و پخش کند. فرمتهای صوتی، ابزارهایی برای ذخیره، انتقال و پخش اطلاعات صوتی هستند. هر یک از این فرمتهای صوتی دارای ویژگیها و مزایایی میباشند که به کاربران امکان مدیریت بهینهی محتوای صوتی را با کیفیت بالا فراهم میکند. با توجه به این تحولات، ارتباط بین صدای آنالوگ و دیجیتال و تأثیر آن بر فرمتهای صوتی بسیار مهم است. با مطالعه مقالات جدید هامیا ژورنال در مورد فرمتهای فشرده سازی عکس و فشرده سازی فایل به بررسی اهمیت و تأثیر فرمتهای فشرده سازی در حوزه عکس و فشردهسازی در انتقال و ذخیرهسازی اطلاعات، بهینهسازی فضای ذخیرهسازی، و تأثیر آن بر کیفیت و سرعت دسترسی به اطلاعات آشنا خواهید شد.
فرمتهای صوتی
فرمت فایل صوتی، استانداردی دیجیتالی برای ذخیرهسازی اطلاعات صوتی است. به طور مثال بعضی مواقع یک فایل صوتی را در دستگاه یا اپلیکیشن پخش موسیقی قرار میدهیم و متوجه میشویم که فایل صوتی پخش نمیشود. در این صورت گفته میشود که فرمت فایل شما با فرمت پشتیبانی شونده دستگاه یا اپلیکیشن پخش موسیقی پشتیبانی نمیشود. همچنین فرمتهای صوتی، کیفیت دادههای صوتی را مشخص میکنند که بر اساس برنامه، از انواع مختلف فرمتهای صوتی استفاده میشود. به طور کلی فرمتهای صوتی به 3 دسته تقسیم میشوند:
- فرمتهای صوتی فشرده نشده «Uncompressed Format»
- فرمتهای صوتی فشرده شده با اتلاف «Lossy Compressed format»
- فرمتهای صوتی فشرده شده بدون اتلاف «Lossless Compressed Format»

فرمتهای صوتی فشرده نشده
در فرمتهای صوتی فشرده نشده، دادههای صوتی بدون هیچگونه کاهش کیفیت یا تغییری در صدا ذخیره میشوند. این فرمتها حجم بالایی دارند و کیفیت صدا در آنها بسیار بالاست.
RAW چیست؟
این فرمت بدون هیچ دستکاری، صدای آنالوگ را به صدای دیجیتال تبدیل میکند و همچنین بیشترین امکانات تدوین را به تدوینگران صدا میدهد. ولی حجم زیادی از حافظه را اشغال میکند. به عنوان مثال، تقریبا 32 مگابایت برای هر دقیقه صدا فضا اشغال میکند.
PCM چیست؟
PCM مخفف «Pulse-Code Modulation» است. این فرمت، سیگنالهای صوتی آنالوگِ خام را به شکل دیجیتال نشان میدهد. فرمت PCM نمایش دقیقی از صدای آنالوگ است و شامل فشردهسازی نمیشود. رایجترین فرمت صوتی، فرمت PCM است که در CD و DVD استفاده میشود.
WAV چیست؟
این فرمت صوتی، مخفف «Waveform Audio File Format» است که توسط مایکروسافت و IBM در سال 1991 توسعه داده شد. فرمت WAV، در سیستم عامل ویندوز مورد استفاده قرار میگیرد. این فرمت همیشه برای ضبط فایلهای صوتی با کیفیت بالا بهتر است. این فرمت افت کیفیت صدا ندارد ولی فضای زیادی را اشغال میکند و بیشتر در صنعت ضبط موسیقی حرفهایی کاربرد دارد.
AIFF چیست؟
«Audio Interchange File Format» یک فرمت فایل صوتی غیرفشرده است که توسط شرکت اپل در سال 1998 ایجاد شد. فایلهای AIFF شامل 2 کانال صدای استریو فشرده نشده با اندازه نمونه 16 بیتی است که با سرعت 44.1 کیلوهرتز ضبط شده است. به دلیل کیفیت بالای صدا، صدای 5 دقیقهای میتواند تا 50 مگابایت فضای دیسک را اشغال کند.

فرمتهای صوتی فشرده شده با اتلاف
در زمان فشردهسازی این نوع فرمتهای صوتی، مقداری از اطلاعات از بین میرود و همچنین اگر فشردهسازی زیاد باشد کیفیت کار افت محسوسی میکند.
MP3 چیست؟
مخفف MPEG-1 Audio Layer III است که توسط یک شرکت آلمانی به نام «Fraunhofer-Gesellshart» در سال 1993 اختراع و توسعه داده شد. این فرمت با هدف حذف دادههای صوتی که فرکانس آنها بیشتر از فرکانسهای قابل شنیدن توسط انسان بود ایجاد شد. این فرمت جزو محبوبترین فرمتهای صوتی جهان است که تمامی دستگاههای دیجیتال قادر به پخش آن هستند. کیفیت صدای یک فایل صوتی MP3 را میتوان با تنظیماتِ پارامتری، مانند نرخ بیت و نرخ نمونه کنترل کرد. حداکثر عمق بیت این فرمت ۱۶ بیت است.
AAC چیست؟
AAC مخفف «Advanced Audio Coding» است که یک استاندارد کدگذاری صوتی برای فشردهسازی صدای دیجیتالِ با اتلاف است. AAC در زمینه موسیقی، فرمت محبوبی محسوب نمیشود و بیشتر برای پخش ترکهای صوتی در گوشیها و کنسولهای بازی استفاده میشود. AAC کیفیت صدای بهتری در مقایسه با MP3 دارد. این فرمت به عنوان فرمت رسانه پیش فرض توسط YouTube، iPhone، iPod، iPad، Apple iTunes و چندین پلتفرم دیگر پذیرفته شده است.
OGG چیست؟
یک فرمت متن-باز (open source) است که توسط بنیاد Xiph.Org نگهداری و توسعه داده میشود. این فرمت جایگاهی در دنیای موسیقی و صدا ندارد و میتوان گفت نوعی تبدیل از فرمتهای دیگر است. در برههای از زمان، کمپانیهای دیجیتال از این فرمت استفاده میکردند ولی طولی نکشید که استفاده از آن بهشدت کاهش یافت.
WMA چیست؟
Windows Media Audio همان طور که از نامش پیداست، در سال ۱۹۹۹ توسط شرکت مایکروسافت معرفی شد. این فرمت به اندازهی MP3 جزئیات صوتی را در طول فشردهسازی از دست نمیدهد و معمولاً در کامپیوترهای دارای سیستم عامل ویندوز استفاده میشود. بنابراین حتی با همان میزان بیت، WMA اغلب کیفیت صوتی بالاتری نسبت به MP3 دارد. فرمت WMA اغلب برای پخش موسیقی آنلاین استفاده میشود و برای ساخت موسیقی حرفهای کاملاً مناسب است. از معایب WAV، میتوان به بالا بودن حجم آن و پشتیبانی نکردن اکثر پلیرهای سختافزاری از این فرمت اشاره کرد. در ضمن، استریم محتوای صوتی با این فرمت بسیار سخت است.

انواع فرمتهای صوتی فشرده شده بدون اتلاف (Lossless)
فرمتهای صوتی فشرده شدهی بدون اتلاف، انواعی از فرمتهای صوتی هستند که به کمک الگوریتمهای فشردهسازی، حجم فایلهای صوتی را بدون افت کیفیت کاهش میدهند.
FLAC چیست؟
مخفف «Free Lossless Audio Codec» است که یک فرمت فشردهسازی صدای منبع-باز است. جذابیت فرمت FLAC در این است که کیفیت صدا را در طول فشردهسازی از دست نمیدهد؛ بر خلاف سایر فرمتهای فشردهسازی صدا مانند WMA یا MP3 که برای کاهش اندازه فایل، قسمتهایی از موسیقی را حذف میکنند.
ALAC چیست؟
Apple Lossless Audio Codec یک کدک صوتی است که توسط شرکت اپل برای فشردهسازی دادههای موسیقی دیجیتال بدون اتلاف توسعه یافته است. اگر به موسیقی علاقهمند هستید، مسلماً به دنبال فایلهایی با کیفیت بهتر خواهید بود که برای این منظور میتوانید از فرمت ALAC استفاده کنید. کاربران اپل از این فرمت استفاده میکنند.
سوالات متداول
نرخ بیت چیست؟
نرخ بیت یا Bitrate، به میزان دادهای اشاره دارد که در هر ثانیه از یک فایل صوتی یا ویدئویی منتشر میشود. این اندازهگیری به واحد کیلوبیت بر ثانیه یا Kbps انجام میشود. در فایلهای صوتی، نرخ بیت معمولاً نشاندهنده کیفیت صوت است؛ یعنی با افزایش نرخ بیت، کیفیت صوت افزایش و با کاهش آن، کیفیت صوت کاهش مییابد.
نرخ نمونهبرداری چیست؟
نرخ نمونهگیری (Sample Rate) به تعداد نمونههایی اشاره دارد که در هر ثانیه از زمان صوتی یا ویدئویی گرفته میشوند. واحد اندازهگیری آن هرتز (Hz) است. افزایش نرخ نمونهگیری معمولاً منجر به افزایش کیفیت صوت و حتی افزایش اندازه فایل میشود. در کل، نرخ نمونهگیری یکی از عوامل اصلی کیفیت صوت یا تصویر یک فایل است و تأثیر مستقیمی بر روی وضوح آن دارد.
عمق بیت چیست؟
عمق بیت (Bit Depth) یکی از ویژگیهای مهم در فرمتهای صوتی و تصویری است. این ویژگی نشاندهنده دقت و وضوح صوت یا تصویر است. به عبارت دیگر، عمق بیت نشان میدهد که چقدر اطلاعات دقیق در هر نقطه از زمان برای صوت یا هر نقطه از تصویر برای ویدئو موجود است. در حوزه صوت، عمق بیت به تعداد بیتهای استفاده شده برای نمایش هر نمونه از سیگنال صوتی اشاره دارد. به عنوان مثال، در یک فایل صوتی با عمق بیت 16، هر نمونه از صوت با استفاده از 16 بیت برای نمایش آن ارائه میشود. افزایش عمق بیت معمولاً منجر به کیفیت بهتر و دقت بیشتر در پخش صوت میشود.
اگر محتوای ما برایتان جذاب بود و چیزی از آن آموختید، لطفاً لحظهای وقت بگذارید و این چند خط را بخوانید:
ما گروهی کوچک و مستقل از دوستداران علم و فناوری هستیم که تنها با حمایتهای شما میتوانیم به راه خود ادامه دهیم. اگر محتوای ما را مفید یافتید و مایلید از ما حمایت کنید، سادهترین و مستقیمترین راه، کمک مالی از طریق لینک دونیت در پایین صفحه است.
اما اگر به هر دلیلی امکان حمایت مالی ندارید، همراهی شما به شکلهای دیگر هم برای ما ارزشمند است. با معرفی ما به دوستانتان، لایک، کامنت یا هر نوع تعامل دیگر، میتوانید در این مسیر کنار ما باشید و یاریمان کنید. ❤️