Skip to main content

Μία από τις πρώτες προσπάθειες για να εκτιμηθεί ο αριθμός των γονιδίων στο ανθρώπινο γονιδίωμα περιλάμβανε meuysm;enoyw genetist;ew, ένα μπαρ στο Cold Spring Harbor της Νέας Υόρκης και μια καθαρή εικασία.

 

Αυτό συνέβη το 2000, όταν βρισκόταν ακόμα σε εξέλιξη μια αλληλουχία ανθρώπινου γονιδιώματος. οι γενετιστές διεξήγαγαν μια σφαίρα για το πόσα γονίδια έχουν οι άνθρωποι και τα στοιχήματα κυμαίνονταν από δεκάδες χιλιάδες έως εκατοντάδες χιλιάδες.

 

Σχεδόν δύο δεκαετίες αργότερα, οι επιστήμονες οπλισμένοι με πραγματικά δεδομένα εξακολουθούν να μην μπορούν να συμφωνήσουν σχετικά με τον αριθμό – ένα χάσμα γνώσης που λένε ότι παρεμποδίζει τις προσπάθειες εντοπισμού μεταλλάξεων σχετικών με την ασθένεια.

 

b43646ad-675a-4576-ac44-59b293495cf2-largeimage.jpg

 

Η τελευταία προσπάθεια για την κάλυψη αυτού του κενού χρησιμοποιεί δεδομένα από εκατοντάδες δείγματα ανθρώπινων ιστών και δημοσιεύτηκε στον διακομιστή προτυπωμάτων BioRxiv στις 29 Μαΐου1. Περιλαμβάνει περίπου 5.000 γονίδια που δεν έχουν εντοπιστεί προηγουμένως – μεταξύ των οποίων σχεδόν 1.200 που φέρουν οδηγίες για την παρασκευή πρωτεϊνών. Και η συνολική συσχέτιση με περισσότερα από 21.000 γονίδια κωδικοποίησης πρωτεϊνών είναι ένα σημαντικό άλμα από τις προηγούμενες εκτιμήσεις, οι οποίες έφεραν τον αριθμό σε περίπου 20.000.

 

Αλλά πολλοί γενετιστές δεν είναι ακόμη πεπεισμένοι ότι όλα τα νέα προτεινόμενα γονίδια θα σταθούν για να εξετάσουν προσεκτικά. Οι επικρίσεις τους υπογραμμίζουν πόσο δύσκολο είναι να εντοπιστούν νέα γονίδια ή ακόμα και να καθοριστεί τι είναι ένα γονίδιο.

 

“Οι άνθρωποι εργάζονται σκληρά γι’αυτό τα τελευταία 20 χρόνια και δεν έχουμε ακόμα την απάντηση”, λέει ο Steven Salzberg, υπολογιστής βιολόγος στο πανεπιστήμιο Johns Hopkins της Βαλτιμόρης, της Μέριλαντ, η ομάδα του οποίου παρήγαγε την τελευταία μέτρηση.

Το 2000, με την κοινότητα γονιδιωματικής να χαόνεται αναφορικά με το πόσα ανθρώπινα γονίδια θα βρεθούν, ο Ewan Birney ξεκίνησε το διαγωνισμό GeneSweep. Ο Birney, συν-διευθυντής του Ευρωπαϊκού Ινστιτούτου Βιοπληροφορικής (EBI) στο Hinxton, Ηνωμένο Βασίλειο, πήρε τα πρώτα στοιχήματα σε ένα μπαρ κατά τη διάρκεια μιας ετήσιας γενετικής συνάντησης και ο διαγωνισμός τελικά προσέλκυσε πάνω από 1.000 συμμετοχές και τζακ ποτ 3.000 δολα΄ρια. Τα στοιχήματα για τον αριθμό των γονιδίων κυμάνθηκαν από περισσότερα από 312.000 έως λίγο κάτω από 26.000, με μέσο όρο περίπου 40.000. Αυτές τις μέρες, το εύρος των εκτιμήσεων έχει συρρικνωθεί – με τις περισσότερες σήμερα μεταξύ 19.000 και 22.000 – αλλά εξακολουθεί να υπάρχει διαφωνία.

 

Ο αριθμός γονιδίων μπορεί να ποικίλει ανάλογα με τα δεδομένα που αναλύονται, τα εργαλεία που χρησιμοποιούνται και τα κριτήρια για την απομάκρυνση ψευδών θετικών. Η τελευταία μέτρηση χρησιμοποίησε ένα μεγαλύτερο σύνολο δεδομένων και διαφορετικές μεθόδους υπολογισμών από προηγούμενες προσπάθειες, καθώς και ευρύτερα κριτήρια για τον ορισμό ενός γονιδίου.

 

Η ομάδα του Salzberg χρησιμοποίησε δεδομένα από το έργο γονότυπου- έκφρασης ιστού (GTEx), το οποίο ανέλυσε το RNA από περισσότερους από 30 διαφορετικούς ιστούς που ελήφθησαν από αρκετές εκατοντάδες νεκρούς. Το RNA είναι ο ενδιάμεσος μεταξύ του DNA και των πρωτεϊνών. Οι ερευνητές ήθελαν να εντοπίσουν γονίδια που κωδικοποιούν μια πρωτεΐνη και εκείνα που δεν εξυπηρετούν ακόμα έναν σημαντικό ρόλο στα κύτταρα. Έτσι συνέταξαν 900 δισεκατομμύρια μικροσκοπικά αποσπάσματα RNA του GTEx και τα ευθυγραμμίστηκαν με το ανθρώπινο γονιδίωμα.

 

Ωστόσο το γεγονός ότι μια έκταση DNA εκφράζεται ως RNA, δεν σημαίνει απαραίτητα ότι είναι ένα γονίδιο. Έτσι, η ομάδα προσπάθησε να φιλτράρει τον θόρυβο χρησιμοποιώντας μια ποικιλία κριτηρίων. Για παράδειγμα, συνέκριναν τα αποτελέσματά τους με γονιδιώματα από άλλα είδη, θεωρώντας ότι αλληλουχίες που μοιράζονται τα απομακρυσμένα σχετικά πλάσματα έχουν πιθανώς διατηρηθεί από την εξέλιξη επειδή εξυπηρετούν έναν χρήσιμο σκοπό και έτσι είναι πιθανό να είναι γονίδια.

 

Η ομάδα έμεινε με 21.306 γονίδια κωδικοποίησης πρωτεΐνης και 21.856 μη κωδικοποιημένα γονίδια – πολλά περισσότερα από αυτά που περιλαμβάνονται στις δύο πιο ευρέως χρησιμοποιούμενες βάσεις ανθρώπινων γονιδίων. Το σύνολο γονιδίων GENCODE, που διατηρείται από το EBI, περιλαμβάνει 19,901 γονίδια κωδικοποίησης πρωτεΐνης και 15,779 μη κωδικοποιημένα γονίδια. Το RefSeq, μια βάση δεδομένων που λειτουργεί από το Εθνικό Κέντρο Βιοτεχνολογικών Πληροφοριών των ΗΠΑ (NCBI), απαριθμεί 20.203 γονίδια κωδικοποίησης πρωτεΐνης και 17.871 μη κωδικοποιημένα γονίδια.

 

Ο Kim Pruitt, ερευνητής γονιδιώματος στο NCBI στη Bethesda του Maryland και πρώην επικεφαλής του RefSeq, αναφέρει ότι η διαφορά οφείλεται εν μέρει στον όγκο των δεδομένων που ανέλυσε η ομάδα του Salzberg. Και υπάρχει μια άλλη σημαντική διαφορά. Τόσο το GENCODE όσο και το RefSeq βασίζονται στη χειρωνακτική θεραπεία – ένα άτομο εξετάζει τα στοιχεία για κάθε γονίδιο και κάνει τελικό προσδιορισμό. Η ομάδα του Salzberg στηρίχθηκε αποκλειστικά σε προγράμματα ηλεκτρονικών υπολογιστών για να κοσκινίσει τα δεδομένα.

 

“Εάν οι άνθρωποι αρέσουν στη λίστα των γονιδίων μας, τότε ίσως μετά από μερικά χρόνια θα είμαστε ο διαιτητής των ανθρώπινων γονιδίων”, λέει ο Salzberg.

 

Αλλά πολλοί επιστήμονες λένε ότι χρειάζονται περισσότερα στοιχεία για να είναι πεπεισμένοι ότι ο κατάλογος είναι ακριβής. Ο Adam Frankish, ένας υπολογιστικός βιολόγος στο EBI που συντονίζει το εγχειρίδιο σχολιασμό του GENCODE, λέει ότι ο ίδιος και η ομάδα του έχουν σαρώσει περίπου 100 από τα γονίδια κωδικοποίησης πρωτεϊνών που ταυτοποίησε η ομάδα του Salzberg. Με την εκτίμησή τους, μόνο ένα από αυτά φαίνεται να είναι ένα πραγματικό γονίδιο κωδικοποίησης πρωτεΐνης.

 

Η ομάδα του Pruitt εξέτασε περίπου μια ντουζίνα των νέων γονιδίων κωδικοποίησης πρωτεϊνών του ομίλου Salzberg, αλλά δεν βρήκε κανένα που να ικανοποιεί τα κριτήρια του RefSeq. Ορισμένοι επικαλύπτονταν με περιοχές του γονιδιώματος που φαίνεται να ανήκουν σε ρετροϊούς που εισέβαλαν στα γονιδιώματα των προγόνων μας. άλλοι ανήκουν σε άλλα επαναλαμβανόμενα τμήματα, τα οποία σπάνια μεταφράζονται σε πρωτεΐνες.

 

Περαιτέρω προσπάθειες καταμέτρησης που προκαλούν σύγχυση είναι ο ασαφής και μεταβαλλόμενος ορισμός ενός γονιδίου. Οι βιολόγοι συνήθιζαν να βλέπουν γονίδια ως αλληλουχίες που κωδικοποιούν πρωτεΐνες, αλλά στη συνέχεια κατέστη σαφές ότι μερικά μη κωδικοποιητικά μόρια RNA έχουν σημαντικούς ρόλους στα κύτταρα. Η κρίση που είναι σημαντική – και πρέπει να θεωρείται ως γονίδιο – είναι αμφιλεγόμενη και θα μπορούσε να εξηγήσει κάποιες από τις διαφορές μεταξύ της καταμέτρησης του Salzberg και άλλων.

 

 

 

164480115_genome_istock_thinkstock.jpg

 

 

Ωστόσο, είναι πιθανό ότι τουλάχιστον κάποια από τα γονίδια που εντοπίστηκαν από την ομάδα του Salzberg θα αποδειχθούν έγκυρα, λέει ο Εμμανουήλ Δερμιτζάκης, γενετιστής του Πανεπιστημίου της Γενεύης στην Ελβετία, ο οποίος συμπροεδρεύει στο έργο GTEx. Δεν προκαλεί έκπληξη το γεγονός ότι η μέτρηση της ομάδας για τα γονίδια κωδικοποίησης πρωτεϊνών είναι αύξηση κατά 5% σε προηγούμενες συγκεντρώσεις, δεδομένου του γιγαντιαίου μεγέθους του συνόλου δεδομένων GTEx.

 

Έχοντας ένα ακριβές αποτέλεσμα/αριθμό όλων των ανθρώπινων γονιδίων είναι σημαντικό για τις προσπάθειες να αποκαλυφθούν οι δεσμοί μεταξύ των γονιδίων και της νόσου. Τα αμέτρητα γονίδια συχνά αγνοούνται, ακόμη και αν περιέχουν μεταλλάξεις που προκαλούν ασθένειες, λέει ο Salzberg. Αλλά η βιαστική προσθήκη γονιδίων στον κύριο κατάλογο μπορεί να δημιουργήσει κινδύνους, λέει και ο Φράγκικ. Ένα γονίδιο που αποδεικνύεται λανθασμένο μπορεί να εκτρέψει την προσοχή των γενετιστών από το πραγματικό πρόβλημα.

 

Ακόμα, οι ασυνέπειες στον αριθμό των γονιδίων από τη βάση δεδομένων στη βάση δεδομένων είναι προβληματικές για τους ερευνητές, λέει ο Pruitt. “Οι άνθρωποι θέλουν μια απάντηση”, προσθέτει, “αλλά η βιολογία είναι περίπλοκη.”