Κάθε χρόνο παράγονται γονιδιωματικά δεδομένα που γεμίζουν… 40 δισεκατομμύρια CD


Αν τα γονιδιωματικά δεδομένα που παράγονται ετησίως στον πλανήτη έπρεπε να αποθηκευτούν σε CD, θα χρειαζόντουσαν 40 δισεκατομμύρια ψηφιακοί δίσκοι μόνο για τα data που έχουν συλλεχθεί στις βάσεις (databases) δημόσιων φορέων, οργανισμών, εργαστηρίων και ινστιτούτων! Κάθε χρόνο υπολογίζεται ότι παράγονται παγκοσμίως 40.000 petabytes (δηλαδή 40 εκατ. terabytes) γονιδιωματικών δεδομένων (όχι μόνο ανθρώπινων, αλλά και φυτικών, ζωικών κτλ.), τα οποία βρίσκονται σε databases δημόσιων φορέων, ενώ ο όγκος όσων κατέχουν τα ιδιωτικά εργαστήρια και φορείς παραμένει άγνωστος, αν και εκτιμάται ότι είναι δέκα έως 100 φορές μεγαλύτερος από εκείνον που κατέχουν τα δημόσια αρχεία! Ο δε χρόνος διπλασιασμού των γονιδιωματικών δεδομένων είναι πλέον οι 12 μήνες, κάτι που σημαίνει ότι σε έναν χρόνο από σήμερα θα έχει παραχθεί όγκος ίσος με εκείνον που παρήχθη συνολικά από τη δεκαετία του ’60!

Παραθέτοντας τα παραπάνω στοιχεία, που αναδεικνύουν την εκθετική αύξηση των γονιδιωματικών δεδομένων, ο δρ. Χρήστος Ουζούνης, διευθυντής Ερευνών στο Ινστιτούτο Χημικών Διεργασιών και Ενεργειακών Πόρων του Εθνικού Κέντρου Έρευνας και Τεχνολογικής Ανάπτυξης (ΙΔΕΠ/ΕΚΕΤΑ) αρχίζει να εξηγεί, μιλώντας στο ΑΠΕ-ΜΠΕ, την εξαιρετικά θετική επίδραση που θα είχε στην επιστημονική έρευνα η χρήση αυτών των data χωρίς περιορισμούς προς ανάλυση, ερμηνεία και δημοσίευση. Μάλιστα, ο Ελληνας επιστήμονας είναι ένας από τους 50 συναδέλφους του από κορυφαία ερευνητικά ιδρύματα ανά τον κόσμο, που προωθούν την έναρξη ενός παγκόσμιου διαλόγου για τη διεύρυνση της διάθεσης των γονιδιωματικών δεδομένων, μέσω της στήλης «Policy Forum» του έγκριτου επιστημονικού περιοδικού «Science».

Γονιδιωματικά δεδομένα, YouTube και Twitter

«Ο όγκος των γονιδιωματικών δεδομένων σήμερα είναι δεκαπλάσιος σε σχέση με εκείνον του YouTube και πολύ μεγαλύτερος από το Twitter, μόνο που ο όγκος αυτών των δύο πλατφορμών δεν μπορεί να αυξηθεί εκθετικά, υπό την έννοια ότι δεν μπορεί κάθε άτομο να ανεβάζει 100 ή 200 βίντεο την ημέρα και δεν μπορείς να βρεις μια άλλη ανθρωπότητα, για να γίνουν χρήστες του Twitter. Αντίθετα, η αύξηση του όγκου των γονιδιωματικών δεδομένων δεν περιορίζεται από αριθμό χρηστών ή από αναρτήσεις, παρά έχει να κάνει μόνο με τεχνολογικούς/τεχνικούς παράγοντες. Είναι λοιπόν τεράστιος ο όγκος. Για διάφορους λόγους, ιατρικής φύσης, το National Institutes of Health (NIH, Εθνικό Ινστιτούτο Υγείας) των ΗΠΑ όπως και άλλοι φορείς, χρηματοδότησαν τη συλλογή αυτών των δεδομένων. Κι εφόσον είναι δημόσιοι οι πόροι που αφιερώθηκαν στην παραγωγή τους, τα δεδομένα αυτά θα έπρεπε να είναι καταχωρισμένα σε public domain, για χρήση στην έρευνα και την τεχνολογική ανάπτυξη στο περιβάλλον, την υγεία, την ενέργεια και τη βιοποικιλότητα» επισημαίνει στο ΑΠΕ-ΜΠΕ ο δρ. Ουζούνης και προσθέτει ότι, δυστυχώς, υπάρχει κατάχρηση του συστήματος από διάφορους φορείς, ο οποίοι κρατούν «κλεισμένα» δεδομένα που έχουν παραχθεί με δημόσιους πόρους μέχρι να τα εξαντλήσουν και να μεγιστοποιήσουν το όφελος από την παραγωγή τους (π.χ., μέσω της χρήσης τους για διδακτορικές διατριβές ή Post-doc έρευνες).

Οπως εξηγεί, ο αντίλογος όσων αντιτίθενται στην ανοιχτή διάθεση των γονιδιωματικών δεδομένων έχει να κάνει με τον κόπο και τον χρόνο που κατέβαλαν για την απόκτησή τους. «Εγώ περπάτησα σε ερήμους για να αποκτήσω αυτά τα δεδομένα», θα σου πει κάποιος που συλλέγει περιβαλλοντικά data για παράδειγμα, ο οποίος θα θελήσει να τα κρατήσει κλεισμένα. Για αυτό και οι 50 επιστήμονες που συνυπογράφουμε αυτή τη δημοσίευση στο «Science» λέμε: επειδή τα δεδομένα αυτά έχουν τεράστια σημασία για την επιστημονική έρευνα και για τον λόγο αυτό είναι καλό να αποτελούν κοινή περιουσία και όχι ιδιοκτησία ενός εργαστηρίου, το οποίο επιφορτίστηκε να τα παράγει με δημόσιους πόρους, χρειάζεται να ανοίξει ο διάλογος, ώστε να βρούμε έναν τρόπο επιβράβευσης στην ακαδημαϊκή έρευνα, που θα λειτουργεί ως κίνητρο για να διατίθενται ανοιχτά».

Το πρόβλημα της ιλιγγιώδους ταχύτητας παραγωγής

Η χρήση αυτών των πληροφοριών έχει οριστεί κατά το παρελθόν από δύο συνθήκες: τη συνθήκη των Βερμούδων (1996) και εκείνη του Fort Lauderdale (2003). Και γενικά, όπως εξηγεί ο δρ. Ουζούνης, η επικρατούσα λογική μεταξύ των χωρών ως προς τη διάθεσή τους είναι αυτή της διεθνούς συνεργασίας, «δηλαδή, αν π.χ., είμαστε Αμερικανοί, παρέχουμε τα δεδομένα μας για μια έρευνα κατά του καρκίνου και στην Ευρώπη, ασχέτως τού φορολογούμενος ποιας χώρας τα έχει πληρώσει και αντίστροφα». Παρά, όμως, την πρόοδο στη διάθεση των δεδομένων που έχει σημειωθεί, η ιλιγγιώδης ταχύτητα παραγωγής τους, φαίνεται ότι έχει ξεπεράσει αυτές τις δύο συμφωνίες, μετά από δεκαετίες. «Το κυριότερο πρόβλημα έγκειται λοιπόν, όπως προαναφέρθηκε, στην παροχή αυτών των δεδομένων: στην ελεύθερη και απρόσκοπτη χρήση τους, αλλά και στο δικαίωμα στην πρώτη δημοσίευση εκείνων που τα παράγουν. Τη στιγμή που διάφοροι οργανισμοί (Ευρωπαϊκή Επιτροπή, χρηματοδοτικοί φορείς) ζητούν τη χωρίς όρια πρόσβαση για όλη την παγκόσμια κοινότητα, εκείνοι που τα παράγουν φαίνεται πως δεν μπορούν να εναρμονιστούν με την ταχύτητα παραγωγής τους και την ανάλογη δημοσίευση».

Ηθικά διλήμματα

Δεν ανακύπτουν όμως ηθικά διλήμματα ως προς την ελεύθερη διάθεση αυτών των δεδομένων; Ήταν το επόμενο ερώτημα προς τον δρα Ουζούνη. Δεδομένου ότι τα γονιδιωματικά δεδομένα ενός ατόμου παρέχουν πληροφορία και για άλλα μέλη της οικογένειάς του, τα οποία δεν έχουν παράσχει τα δεδομένα τους, δεν ανακύπτει ζήτημα; Και ποιος εγγυάται ότι αν τα δεδομένα αυτά, που δείχνουν π.χ, τη γενετική προδιάθεση για ανίατα νοσήματα, διατίθενται ανοιχτά και ελεύθερα, δεν θα αξιοποιηθούν από ασφαλιστικές εταιρείες για παράδειγμα, για να μην ασφαλίσουν κάποιον ή για να τον ασφαλίσουν πάρα πολύ ακριβά;

«Μεταξύ των γονιδιωματικών δεδομένων υπάρχουν αυτά που δεν είναι ευαίσθητα: περιβαλλοντικά και επιδημιολογικά, που παρέχουν πληροφορία π.χ., για τη γρίπη Η1Ν1, ενεργειακά (π.χ., βακτήρια που βοηθούν στην παραγωγή φαρμάκων ή καυσίμων), φυτικά ή ζωικά. Και μετά υπάρχουν τα ευαίσθητα, που είναι τα ανθρώπινα, για τα οποία προφανώς ανακύπτουν ηθικά διλήμματα και πρέπει να υπάρχουν προβλέψεις για την προστασία των προσωπικών δεδομένων. Αυτό που λέμε λοιπόν είναι ότι δεν κρατάμε τα δεδομένα κλεισμένα, αλλά βεβαίως ούτε τα μοιράζουμε χωρίς να τηρούνται όλες οι ασφαλιστικές δικλείδες και όλες οι νομικές διατάξεις που ισχύουν για την προστασία των προσωπικών δεδομένων» καταλήγει ο δρ Ουζούνης, σύμφωνα με τον οποίο τα δημόσια αρχεία που τηρούν γονιδιωματικά δεδομένα είναι -μεταξύ άλλων- το αμερικανικό National Center for Biotechnology Information, το ευρωπαϊκό European Bioinformatics Institute και το ιαπωνικό DNA Data Bank of Japan.



Πηγή