דחיסת קבצים
מאת רומן זאיקין כותב מטעם האקריו המרכז להכשרת והשמת עובדים למקצועות ההיי- טק.
איך מקובץ שגודלו 2 Gigabyte נוצר קובץ דחוס בגודל 200 Megabyte ?לאן נעלם המידע? ואיך זה אפשרי?
כפי שוודאי שמתם לב, ישנן תוכנות רבות המאפשרות לקחת קובץ אשר צורך נפח דיסק רב ולקבל פלט קטן בהרבה מן המקור.
איך הן עושות זאת ומה קורה מאחורי הקלעים?
לצורך הדוגמה נשתמש במשפט הפשוט הבא:
"לא, לא, לא! אתה יכול לעשות את זה, אתה יכולה לעשות את זה"
בשלב הראשון התוכנות מחפשות מידע שחוזר על עצמו.כגון המילה לא, מילה זו מופיע פעמים רבות ולכן נכניסה לטבלה אשר תעזור לנו בעת תהליך הקיבוץ.
בטבלה זו לכל רצף אותיות אשר חוזר על עצמו מספר פעמים מקצים אות או תו בודד לצורך המיפוי כך:
1 = לא
כעת נשתמש בטבלה על המשפט הנתון ונראה את הפלט החדש שלנו:
"1, 1, 1! אתה יכול לעשות את זה, אתה יכולה לעשות את זה"
כפי שניתן לראות קיצרנו את אורך המשפט ובכך חסכנו מקום. יחד עם זאת ניתן לראות שיש עוד מילים שחוזרות על עצמן, מילים אלו נכניס גם כן לטבלה.
1=לא
2=את
3=יכול
4=לעשות
5=זה
שימו לב, בטבלה השתמשתי גם ברווחים שאחרי ולפני המילה כדי לחסוך בתווים. בנוסף המילים "את" ו"-אתה" מכילים את אותן האותיות "את" לכן השתמשתי במילה "את" כמילת מפתח.
לאחר שעדכנו את הטבלה נשתמש בה כדי לדחוס את המשפט, כך יראה הפלט הדחוס:
"1, 1, 1!2ה443, 2ה433"
שמים לב לאורך המשפט? הצלחנו לדחוס את המשפט כמעט פי שתיים. תארו לעצמכם כמה מידע ניתן לדחוס בשיטה זו אם נבצע אותה על ספר שלם.
לדחיסת מידע יש יתרונות רבים בנוסף לחיסכון בשטח דיסק, נמנה כמה מהם:
- ניתן להשתמש בפעולת הדחיסה לצורך איגוד מספר קבצים לקובץ בודד מה שיקל עלינו בשליחת הקבצים ברשת או במייל.
- ניתן להשתמש בפעולת הדחיסה לצורך הצפנת הקבצים והקצאת סיסמה לקובץ וכך בעצם לשמור על הקבצים שלנו בטוחים יותר ומוגנים יותר.
- ניתן להשתמש בפעולת הדחיסה כדי לחלק את הקובץ למספר חלקים ובכך לאפשר את צריבתו על דיסק קטן יותר מגודל הקובץ.
לאלו מכם שאינם מכירים תוכנות דחיסה הינה רשימה של כמה מהמוכרות יותר
כאשר מדובר בדחיסת בתמונות, וידיאו או אודיו השיטה שונה, כיוון שלרוב המידע כבר מגיע דחוס וקשה יהיה לדחוס אותו בשנית. כפתרון לפעמים אנו משנים את פורמט הקובץ בכך חוסכים במקום על ידי תוכנת ה-FormatFactory.
או לחילופין ניתן לדחוס את הקובץ עלי ידי וויתור על מידע פחות חיוני לקובץ על ידי אלגוריתמים. אשר יתבטא באיבוד פיקסלים בתמונות או יפגע באיכות השמע.
בשיטת וויתור המידע לרוב אין תבניות או שיטות דחיסה אשר ישפיעו בצורה ניכרת על גודל הקובץ.
לשם הדגמה, נשתמש באתר הבא: http://jpeg-optimizer.com/
ובתמונה הבאה:
לאחר שהכנסתי את התמונה למנוע הדחיסה של האתר,קיבלתי את הפלט הבא:
כפי שניתן לראות בדוגמה, ככל שדחסתי יותר את גודל התמונה כך הושפעה איכות התמונה.
לכן אני ממליץ שלא תדחסו יותר מידי ואם זה אפשרי אל תדחסו מידע כלל. לאלו מכם שבכל זאת חייבים לדחוס מידע – תנסו למצוא את עמק השווה.
לעיתים אף שינוי פורמט הסרט או התמונה יחסכו לכם יותר מקום מכל סוג דחיסה שהיא
- לסרטים אני ממליץ להמירם לפורמט –flv
- עבור שמע השתמשו ב- mp3
- ועבור תמונות –jpg
בפן אבטחת המידע אני ממליץ לדחוס קבצים חשובים להצפינם ולהקצות להם סיסמאות. כך לא רק שתחסכו מקום אלה גם תהיו בטוחים יותר.
הכתבה נכתבה על ידי מומחה מבית הספר למקצועות ההיטק האקריו – עבור PCGalaxy באופן בלעדי.