Συμπίεση Δεδομένων: Τι Είναι και Πώς Λειτουργεί

Διαδικασία μείωσης του όγκου αρχείων διαφόρων ειδών

Η συμπίεση δεδομένων είναι η διαδικασία μείωσης του όγκου αρχείων διαφόρων ειδών, μέχρι και 99% από το αρχικό τους μέγεθος.

Στόχος της συμπίεσης είναι η ταχύτερη μεταφορά μέσω δικτύων και η εξοικονόμηση αποθηκευτικού χώρου. Τα συμπιεσμένα δεδομένα μπορούν να είναι είτε αυτόνομα αρχεία, όπως τα JPG, MP3, MP4, κλπ, είτε ολοκληροι φάκελοι που μπορεί να περιέχουν και υποφακέλους.

Στον οδηγό που ακολουθεί θα δούμε τα είδη της συμπίεσης δεδομένων, και τα πιο γνωστά προγράμματα που χρησιμοποιούμε. Απαραίτητη προϋπόθεση για τη συμπίεση δεδομένων είναι να μπορέσουμε να τα επαναφέρουμε στην αρχική μη-συμπιεσμένη μορφή τους. Η διαδικασία αυτή ονομάζεται αποσυμπίεση δεδομένων.



Που χρησιμεύει η συμπίεση δεδομένων

Η ανάγκη για τη συμπίεση δεδομένων προέκυψε αρκετά νωρίς στην ιστορία των οικιακών υπολογιστών. Οι δισκέτες 5,25 και 3,5 ιντσών είχαν αρκετά περιορισμένη χωρητικότητα. Ταυτόχρονα, οι πρώτοι οικιακοί σκληροί δίσκοι, στις αρχές της δεκαετίας του '80 είχαν εξαιρετικά υψηλό κόστος ανά Megabyte, και για αρκετά χρόνια ήταν απλησίαστοι για το μέσο χρήστη.
Με τον αποθηκευτικό χώρο να είναι τόσο περιορισμένος και να κοστίζει τόσο πολύ, η συμπίεση δεδομένων ήταν η λύση που θα μείωνε σημαντικά τον όγκο των αρχείων, επιτρέποντας την αποθήκευση περισσότερων του ενός στην ίδια δισκέτα ή τον ίδιο δίσκο.
Αντίστοιχα μεγάλη ήταν/είναι η σημασία που είχε η συμπίεση δεδομένων στη διακίνηση και ανταλλαγή αρχείων μέσω Internet.


Χρειάζεται σήμερα η συμπίεση δεδομένων;
Σήμερα, οι σκληροί δίσκοι έχουν πολλαπλάσια χωρητικότητα, σε ένα κλάσμα του κόστους.
Τη στιγμή που γράφονται αυτές οι γραμμές, μπορούμε να αγοράσουμε ένα σκληρό δίσκο του 1TB με περίπου 50 ευρώ, ενώ θα βρούμε μοντέλα μέχρι και 8TB, σε τιμές που είναι μεν σχετικά υψηλές, αλλά όχι απλησίαστες, αν χρειαζόμαστε τη χωρητικότητα.
Ουσιαστικά, ένας μέσος χρήστης χρειάζεται προσπάθεια – πχ να κατεβάζει πολλές ταινίες ή να εγκαθιστά πολλαπλά μεγάλου όγκου παιχνίδια παιχνίδια – για να γεμίσει ένα σκληρό δίσκο έστω και του 1TB.
Παρ' όλα αυτά, η συμπίεση δεδομένων εξακολουθεί να είναι επίκαιρη, κυρίως όσον αφορά τα δίκτυα και την ανταλλαγή δεδομένων.


Τι είναι η απωλεστική και η μη απωλεστική συμπίεση δεδομένων
Ενώ υπάρχουν αρκετές δεκάδες αλγορίθμων για τη συμπίεση δεδομένων, όλοι τους χωρίζονται σε δύο βασικές κατηγορίες: στους απωλεστικούς αλγόριθμους, και τους μη απωλεστικούς.
Στη μη απωλεστική συμπίεση δεδομένων, αν συμπιέσουμε ένα αρχείο, και μετά το αποσυμπιέσουμε, τα δεδομένα του παραμένουν ακριβώς τα ίδια. Δεν χάνεται τίποτα κατά τη διαδικασία, κάτι που είναι και το ζητούμενο.
Η μη απωλεστική συμπίεση είναι η μόνη μέθοδος που μπορεί να εφαρμοστεί σε αρχεία εφαρμογών, αρχεία κειμένου, ή οποιαδήποτε αρχεία με σημαντικά δεδομένα.


Υπάρχουν όμως και αρκετά προγράμματα συμπίεσης που είναι απωλεστικά. Αυτό σημαίνει πως κατά τη συμπίεση των δεδομένων, ο απωλεστικός αλγόριθμος “πετάει” ελεγχόμενα ένα κομμάτι της πληροφορίας του αρχείου, για να μειώσει περισσότερο τον όγκο του. Σαν αποτέλεσμα, μετά την αποσυμπίεση, ένα μέρος της πληροφορίας έχει χαθεί οριστικά.
Η απωλεστική συμπίεση χρησιμοποιείται αποκλειστικά σε αρχεία πολυμέσων, όπως εικόνες, βίντεο, και αρχεία ήχου. Στα πολυμέσα μπορούν να γίνουν αλλαγές στην εικόνα και τον ήχο που να μην είναι αντιληπτές από το ανθρώπινο μάτι ή το αυτί αντίστοιχα.
Για παράδειγμα, η πιο διαδεδομένη τεχνική για τη συμπίεση δεδομένων σε αρχεία φωτογραφιών ή βίντεο είναι η μείωση των συνολικών χρωμάτων της εικόνας.
Η μέθοδος αυτή βασίζεται στο γεγονός ότι το ανθρώπινο μάτι δεν έχει την δυνατότητα να αντιληφθεί όλα τα μήκη κύματος των χρωμάτων που μπορεί να παράγει η οθόνη. Κόβοντας λοιπόν συγκεκριμένες αποχρώσεις, πρακτικά έχουμε την ίδια ποιότητα με μικρότερο όγκο.


Προγράμματα συμπίεσης γενικής χρήσης
Η πιο συνηθισμένη μορφή που θα βρούμε προγράμματα μη απωλεστικής συμπίεσης είναι είναι οι .ZIP, .7Z, και .RAR.Αρχεία .ZIP
Η τεχνολογία zip δημιουργήθηκε από τον Phil Katz to 1989, και μπορεί να χρησιμοποιήσει διάφορους αλγόριθμους συμπίεσης. Συνήθως χρησιμοποιεί τον αλγόριθμο DEFLATE, που συνδυάζει τον LZ77, που είναι πρόγονος LZW, και την κωδικοποίηση Huffman, που είναι μια μαθηματική διαδικασία για μη απωλεστική συμπίεση.
Τα Windows υποστηρίζουν την τεχνολογία zip από το 1998, και δεν απαιτείται η εγκατάσταση κάποιου τρίτου προγράμματος για να πραγματοποιήσουμε συμπίεση και αποσυμπίεση τέτοιων αρχείων.


Αρχεία .RAR
Ενώ τα Windows δεν αναγνωρίζουν τα αρχεία .RAR, και χρειάζεται να κατεβάσουμε κάποια εξωτερική εφαρμογή για να τα αποσυμπιέσουμε, είναι εξαιρετικά διαδεδομένα μεταξύ των power users, σχεδόν όσο και τα .ZIP.
Όπως και τα αρχεία .ZIP, τα RAR είναι containers που μπορούν να περιέχουν συμπιεσμένα αρχεία και φακέλους. Το όνομα RAR (Roshal ARchive) προήλθε από το όνομα του δημιουργού αυτής της συμπίεσης, Eugene Roshal.

Αρχεία .7Z
Όπως και τα αρχεία zip, έτσι και τα αρχεία 7z αποτελούν containers για άλλα αρχεία και φακέλους, ενώ χρησιμοποιούν τους ίδιους αλγόριθμους, όπως τον DEFLAT, κάποιες άλλες παραλλαγές του LZ77, τον Bzip2 και τον PPMd.


Γενικό Παράδειγμα: Στην εικόνα επάνω έχουμε 3 αρχεία εικόνας τα οποία επιλέξαμε μαζί και με δεξί κλικ τα συμπιέσαμε. Βλέπουμε οτι ενώ το αρχικό μέγεθος των 3 αρχείων ήταν 3,58 ΜΒ, το αρχείο που προέκυψε έχει μέγεθος 2,66 ΜΒ. Αν δούμε αναλυτικά τις ιδιότητες ων αρχείων (συμπιεσμένων και μη) θα δούμε ότι η μείωση στο νέο αρχείο προήλθε κυρίως από τη μείωση του μεγέθους του αρχείου .psd (αρχείο Photoshop).


Για περισσότερες πληροφορίες για τη συμπίεση των αρχείων ζητήστε να σας στείλω την ενότητα των Windows

από το βιβλίο μου της Πληροφορικής.

Δεν έχει νόημα να αναλύσουμε εδώ ποιο από τα τρία παραπάνω προγράμματα κάνει την καλύτερη συμπίεση, και ποιο είναι το πιο γρήγορο στη συμπίεση και αποσυμπίεση. Και τα τρία κάνουν τη δουλειά τους.
Σε κάθε περίπτωση, πάντως, δεν έχει νόημα να προσθέσουμε σε .ZIP, .RAR, ή 7Z, αρχεία που είναι ήδη συμπιεσμένα. Δεν πρόκειται να συμπιεστούν περισσότερο, και το πιθανότερο είναι να καταλήξουμε με ένα αρχείο μεγαλύτερου μεγέθους!
Αυτό που είναι σημαντικό είναι να κατανοήσουμε τα μεγάλα πλεονεκτήματα που κατέχει η συμπίεση δεδομένων και τον σημαντικό ρόλο της στην βελτίωση των πολυμέσων.
Αν έχετε κάποια απορία σχετικά με την συμπίεση δεδομένων, επικοινωνήστε μαζί μας μέσω της φόρμας Επικοινωνίας.


Μαρία Ζάππα-Κασαπίδη

Συγγραφέας βιβλίων Πληροφορικής