כיצד אודיו דחיסת עבודה, ומה הוא "ללא אובדן" אודיו?

רק השבוע, Spotify החלה בדיקות "lossless" קבצי אודיו. אבל מה הוא "lossless" אודיו, בדיוק, וכיצד אודיו דיגיטלי דחיסת עבודה?

כיצד פועל דחיסת אודיו?

המטרה של דחיסת שמע היא לצמצם את מספר הביטים הנדרשים לשחזור מדויק של צליל אנלוגי. התהליך הראשון שנביט בו נקרא "lossy". דחיסת Lossy היא טכניקה חד כיווני שזורקת נתונים לא קריטיים כדי לחסוך מקום. טכניקות אלה הן השיטות הנפוצות ביותר המשמשים לדחיסת קבצי שמע, להופיע ב- MP3, AAC ו- WMA קבצים כאחד. ישנם שני מקומות codecs lossy נראה לשמור סיביות: קצב סיביות psychocacoustics.

קצב סיביות

קצב סיביות מודד את כמות הביטים המשמשים לקידוד שניה אחת של שמע. לדוגמה, אם אנו משתמשים בקידוד באיכות נמוכה, 8 קילו-בתים לשנייה (kbps), האלגוריתם שלנו מוגבל לשימוש רק ב -8 קילו-בתים של נתונים כדי לתאר כל שנייה של אודיו. זה כמו לנסות לתאר תמונה בצבע מלא עם רק כמה מאות פיקסלים. אתה יכול לקבל את הזכות strokes ימין, אבל באופן כללי אתה תהיה מסתכל על התמונה מושפל קשות. אם אנו משתמשים בקצב סיביות גבוה יותר כמו 192 kbps, יש לנו מספיק מקום לכסות פרטים ניואנסים. כדי לחזור לדוגמת הצילום שלנו, יש לנו כעת פיקסלים מספיק כדי לתאר את האורות השונים, כהים וצבעים בתמונה. קצב סיביות גבוה אינו קובע את איכות ההקלטה בפני עצמה, אך קצב סיביות נמוך יכול להגביל באופן חמור את איכות הפלט.

פסיכו-אקוסטיקה

הפסיכו-אקוסטיקה היא המדע של איך המוח מבין צלילים. על ידי מניפולציה של מוזרויות ידועות באופן שבו בני האדם תופסים צליל, אלגוריתמים דחיסה יכול להסיר בחוכמה פרטים כי רוב האוזניים האנושיות לא לפספס. המטרה היא "לסובב" מידע זה לא ישנה את איכות השמע נתפסת של המסלול, בהסרה הסרת מידע חשוב בלבד.

לדוגמה, אתה אולי יודע את טווח טיפוסי של שמיעה אנושית היא בין 20Hz ו 20kHz. ברור, קולות מחוץ לטווח זה ניתן להסיר. יתר על כן, טווח מפורט ביותר של שמיעה אנושית הוא בין 100Hz ו 4kHz, והסרת קולות שקטים מחוץ לטווחי תדרים אלה עושה נזק מינימלי לאיכות ההקלטה. אנחנו יכולים לעשות טריק דומה עם קולות מנוגדים מאוד. אם נשמע קול חזק מאוד וצליל שקט מאוד בו זמנית, הקול השקט הרבה יותר קשה לתפוס מאשר זה יהיה בפני עצמו. אנקודרים לנצל את זה "קול מסכה" כדי להסיר את הצליל שקט, שמירת סיביות בתהליך.

התדירות יכולה גם להשפיע על הצליל שאנו קולטים. לדוגמה, תוף מתמשך בתדירות נמוכה תוף נוטה להטביע את ההרמוניות עדין יותר, בתדר גבוה יותר של מכשירים מלודיים. וגם מסוך קול יעיל במיוחד מעל 15kHz, שבו השמיעה האנושית היא בדרך כלל פחות רגיש מלכתחילה.

תוכניות דחיסת אודיו נפוצות כמו MP3 מנצלות את מלוא טווח אפשרויות הדחיסה תוך ניסיון להישאר נאמן להקלטה המקורית ככל האפשר. כמובן, כמה אנשים מרגישים כמו הסרת תדרים אלה עושה נזק רציני ההקלטה. זו הסיבה סטנדרטים דחיסה lossless קיים.

מה זה "ללא אובדן" אודיו?

אובדן דחיסת אודיו של המטרה היא לצמצם את גודל הקובץ, תוך השארת אודיו המקורי untouched. רכיבי codec אלה אינם משתמשים בטכניקות הדחיסה הקבועות לעיל, תוך התמקדות בשיטות דחיסה של נתונים. הם משתמשים בטכניקות דחיסה ללא אובדן נתונים שהושאלו מאלגוריתמים של דחיסת קבצים כמו ZIP כדי להסיר נתונים מיותרים תוך שמירה על שלמות המידע הבסיסי. שני רכיבי codec אודיו פופולריים ללא אובדן נתונים - FLAC ו- Apple Lossless (ALAC) - הן תוכניות שימוש המבוססות על דחיסת ZIP.

התמקדות בדחיסת נתונים פירושה רק שימור של פרטים רבים, כי MP3 וסטנדרטים אחרים lossy ימחקו. אם יש לך אוזניים חדות הגדרה באיכות גבוהה הקשבה, ההבדל יכול להיות מוחשי.

דחיסה ללא אובדן הוא לא רק טוב להקשיב, אם כי: זה גם כלי אחסון גדול. בדיוק כמו שאתה לא רוצה 72dpi JPG להיות עותק דיגיטלי יחיד של תמונות של אנסל אדם, אנחנו לא רוצים רק 128kbps MP3s של "סוג של כחול." סטנדרטים ללא אובדן כמו FLAC מאפשרים לנו לאחסן אודיו ביעילות מבלי לזרוק משם פוטנציאל נתונים יקרי ערך. הם גם עושים remastering ו redistribution כי אודיו קל יותר, שכן החל עם מאסטר uncompromised פירושו מוצר מוגמר באיכות גבוהה יותר.

מסקנה: האם אתה יכול לספר את ההבדל?

פורמטי אודיו ללא אובדן נתונים מאפשרים הקלטות צליל טובות יותר. אבל לפעמים ההבדלים בין MP3 באיכות גבוהה לבין קובץ lossless הם כמעט בלתי מורגש, במיוחד לאוזן לא מאומנת. אם אתה רוצה לראות אם האוזניות שלך (ואוזניים) הם להוטים מספיק כדי לספר את ההבדל, NPR יש מבחן כיף; רק יש לזכור כי אוזניות זולות ורמקולים ניידים לא יוכלו לשחזר את ההבדלים הדקים בין אודיו ללא אובדן ו MP3s. לניתוח רציני יותר של רכיבי codec, לבדוק את דירוגים של Encoder SoundExpert.