Una eina per conèixer l’estructura funcional de les proteïnes

«AlphaFold és un exemple del cercle virtuós de la ciència en obert. I és considerada la contribució actual més significativa de la intel·ligència artificial per fer avançar el coneixement»

Proteïna recreada amb el programa Alphafold
Proteïna recreada amb el programa Alphafold | ND
04 d'agost del 2021
Actualitzat a les 16:18h
Durant la primera meitat del segle XX, se sabia que l’herència havia de tenir un suport material, però es dubtava de quin era. La versatilitat de les proteïnes les feia fermes candidates. Però, finalment va quedar clar que són les executores de les accions moleculars dels organismes i que el bagatge genètic de cadascú de nosaltres està en la seqüència de DNA.

Pràcticament tots els processos biològics depenen de la presència o l’activitat de les proteïnes. N’hi ha de reguladores, com la insulina, que mantén estable el nivell de glucosa en sang; estructurals, com el col·lagen, que suporta altres teixits; motores, com la miosina dels músculs; de reserva, com la clara de l’ou; defensives, com les immunoglobulines, els anticossos; de transport, com l’hemoglobina; receptores, com moltes de la membrana cel·lular, i catalítiques, com els enzims.

Tot i la gran diversitat de les proteïnes, la seva estructura segueix un pla general força senzill: una seqüència lineal d’aminoàcids que, en combinar-se per formar proteïnes, ofereixen més diversitat que els àcids nucleics. Perquè els aminoàcids en són vint, mentre que les bases nuclèiques, quatre. Si fem un símil amb el llenguatge, el material genètic s’organitza en paraules de tres lletres formades amb quatre símbols diferents; mentre que les proteïnes formen paraules sense restricció de longitud fetes amb 20 lletres diferents. D’aquí la seva versatilitat.

Però els aminoàcids de les proteïnes no són químicament inerts, no resten com un filament. Els seus radicals químics interactuen i fan que les molècules es pleguin com ho poden fer la llana desfilada del cabdell o els rínxols del cabell. Ambdues estructures proteiques. El que fa una permanent de perruqueria és generar noves connexions (ponts disulfur) per enllaçar els aminoàcids de la queratina a diferents regions; bucles diferents del cabell s’apropen fent el rínxol.

La funcionalitat de les proteïnes es basa en aquesta estructura tridimensional en un efecte clau-pany, més que en la seqüència. És la forma final de la proteïna la que li dona la capacitat de funció. Aquestes macromolècules essencials per a la vida representen el 50% del pes sec dels teixits. El genoma humà conté les instruccions per ser traduït en 20.000 proteïnes; és el proteoma humà, el conjunt de proteïnes expressades pels humans.

Un altre exemple d’interacció tridimensional la fa el SARS-CoV-2 en infectar una cèl·lula humana. Primer fixa la proteïna de l’espícula a la superfície de la cèl·lula de l’hoste; després fusiona la seva membrana amb la de la cèl·lula humana per deixar anar la càrrega genètica, la que provoca la malaltia. Aquesta fusió s’inicia per un component de l’espícula: l’anomenat pèptid de fusió de la proteïna S. Conèixer les interaccions tridimensionals entre aquest pèptid de fusió del virus i la membrana cel·lular humana pot permetre dissenyar fàrmacs que interrompin específicament la interacció i puguin evitar que el SARS-CoV-2 s’acobli a les nostres cèl·lules. Impedir la infecció.

Tot i la importància de l’estructura tridimensional, fins ara només es coneixia un terç del proteoma humà; i, en molts casos, només parcialment. Les tècniques de cristal·lografia aplicades durant més de cinquanta anys per conèixer l'estructura tridimensional de les proteïnes han dut avenços indiscutibles; però són minucioses, laborioses, i sovint costoses. Per això s’han desenvolupat tècniques computacionals per predir la forma d'una proteïna a partir de la seqüència d'aminoàcids.

Fa dues setmanes es va publicar a la revista Nature la darrera versió d'AlphaFold, una eina d’intel·ligència artificial que, a partir de la seqüència d’aminoàcids, ha predit l’estructura 3D de gairebé tot el proteoma humà i d’altres 20 organismes, com els ratolins, el blat de moro o el paràsit de la malària. Ha estat desenvolupada a Londres per l’empresa DeepMind, germana de Google, amb la col·laboració de l’European Bioinformatics Institute, que forma part del principal laboratori europeu en ciències de la vida, l’EMBL-EBI.

A la base de dades hi ha disponibles en accés obert més de 350.000 estructures proteiques. Tant l’eina predictiva com la base de dades ofereixen nous i poderosos recursos per estudiar l’estructura tridimensional —i funcional— de les proteïnes. I imatges precioses. S’estima que l’ús de l’eina permeti que la base de dades creixi fins a tenir 130 milions d’estructures a final d’any. Entre altres, es busquen medicaments per tractar malalties rares i desateses.

AlphaFold és un exemple del cercle virtuós de la ciència en obert. I és considerada la contribució actual més significativa de la intel·ligència artificial per fer avançar el coneixement científic en biologia i pel que pot aportar a la societat.