H DeepMind σε συνεργασία με το Ευρωπαϊκό Ινστιτούτο Βιοπληροφορικής του European Molecular Biology Laboratory (EMBL-EBI) δημοσιεύει μια ανοικτή βάση με 200 εκατομμύρια δομές πρωτεϊνών μέσα από το AlphaFold Protein Structure Database (AlphaFold DB). Με το AlphaFold, ένα σύστημα Τεχνητής Νοημοσύνης που έχει αναπτύξει η DeepMind, είναι η δυνατή η πρόβλεψη της τρισδιάστατης δομής μιας πρωτεΐνης από την αλληλουχία των αμινοξέων της.
Όλη η βάση είναι ανοικτά διαθέσιμη μέσω του Google Cloud Public Datasets και οι περισσότερες εγγραφές στη βάση δεδομένων πρωτεϊνών UniProt έχουν πλέον μια δομή. Η επέκταση της βάσης δεδομένων περιλαμβάνει δομές για ένα ευρύ φάσμα ειδών, συμπεριλαμβανομένων φυτών, βακτηρίων, ζώων και άλλων οργανισμών, ανοίγοντας νέους δρόμους έρευνας στις επιστήμες της ζωής που εκτιμάται πως θα έχουν αντίκτυπο στις παγκόσμιες προκλήσεις, συμπεριλαμβανομένης της βιωσιμότητας, της επισιτιστικής ανασφάλειας και ξεχασμένες τροπικές ασθένειες.
Mέσα σε έναν χρόνο, περισσότερες από 1.000 επιστημονικές εργασίες έχουν αναφέρει την AlphaFold DB (την προηγούμενη έκδοση της η οποία περιλάμβανε μόλις 1 εκατομμύριο δομές) και πάνω από 500.000 ερευνητές από περισσότερες από 190 χώρες έχουν δει πάνω από δύο εκατομμύρια δομές. Με βάση το AlphaFold έχουν αναπτυχθεί εργαλεία όπως το Foldseek και το Dali που επιτρέπουν στους χρήστες να αναζητούν καταχωρήσεις παρόμοιες με μια δεδομένη πρωτεΐνη.