AI-verktyget Alphafold har förbättrats så att det nu kan förutsäga formen på väldigt stora och komplexa proteinstrukturer.
Forskarna vid Linköpings universitet har också lyckats integrera experimentella data i verktyget.
Resultaten, publicerade i Nature Communications, är ett steg mot effektivare utveckling av nya proteiner för bland annat läkemedel.
I alla levande organismer finns det en enorm mängd olika proteiner som reglerar cellernas funktioner. I princip allt som händer i kroppen, från att styra muskler och bilda hår till att transportera syre i blodet och smälta mat, har att göra med proteiner. Men proteiner finns även utanför kroppen i till exempel tvättmedel och läkemedel.
Proteiner är stora molekyler som består av 20 olika aminosyror som sitter ihop i långa rader, ungefär som pärlor på ett halsband. Raderna, eller kedjorna, kan vara allt från 50 upp mot några tusen aminosyror lång. Det ger upphov till flera miljarder olika kombinationer som i sin tur avgör vilken tredimensionell form proteinet får. Beroende på proteinkedjans form, det vill säga hur den veckas, får proteinet helt olika funktioner.
I över 50 års tid har forskare försökt både förutsäga och utforma olika proteinstrukturer för att få djupare förståelse för kroppens mekanismer, olika sjukdomar och för att utveckla nya typer av läkemedel. Ett mödosamt och dyrt arbete med mycket manuell handpåläggning.
Men år 2020 släppte företaget Deepmind en öppen programvara som kallas för Alphafold. Det är en artificiell intelligens baserad på så kallade neurala nätverk som med stor säkerhet kan förutsäga hur proteiner kommer att veckas och därmed vilka funktioner de får. Det var ett genombrott som också resulterade i Nobelpriset i kemi år 2024.
Dock har programmet haft sina begränsningar. Bland annat har det inte kunnat förutspå allt för stora proteinsammansättningar och inte heller dra slutsatser från experimentella eller ofullständiga data.
Nu har forskare vid Linköpings universitet utvecklat Alphafold ytterligare för att komma till bukt med de bristerna. Tillägget som de kallar AF_unmasked kan nu kan ta in information från experiment och partiella data samt förutsäga väldigt stora och komplexa proteinstrukturer.
– Vi ger en ny typ av input till Alphafold. Tanken är att få hela bilden, både från experiment och neurala nätverk vilket gör det möjligt att bygga större strukturer. Men du kan också ha ett utkast till en struktur som du matar in i Alphafold och får ett relativt säkert resultat, säger Claudio Mirabello, docent vid Institutionen för fysik, kemi och biologi vid Linköpings universitet.
Tanken med AF_unmasked är att forskare ska förfina de experiment som görs genom att ge vägledning hur forskarna skulle kunna utforma proteinet. Det är ett steg mot ännu bättre förståelse av proteinernas funktioner och för att utforma nya typer av proteinläkemedel.
Genombrottet med Alphafold möjliggjordes av att forskare världen över samlat in data sedan 1970-talet om strukturen för cirka 200 000 olika proteiner i en databas. Den databasen utgjorde träningsdata för Alphafold. Det som slutligen gjorde att det fungerade på stor skala var den tekniska utvecklingen av superdatorer som använder grafikprocessorer för tunga beräkningar.
Björn Wallner är professor i bioinformatik vid Linköpings universitet och har jobbat med en av de tre Nobelprisvinnarna.
– Möjligheterna för proteindesign är oändliga, bara fantasin sätter gränser. Det går att utveckla proteiner för användning både inuti och utanför kroppen. Man måste alltid hitta nya svårare problem när man löst de tidigare. Och inom vårt fält är det inga problem att hitta problem, säger Björn Wallner.
Tillsammans med Claudio Mirabello utvecklade han en föregångare till Alphafold som också inspirerade Deepmind i utvecklingen av verktyget. Tack vare det Google-ägda företages resurser kunde de sedan utveckla vad som idag är ett oumbärligt verktyg för världens proteinforskare.
– Alphafold var inte det första verktyget som använde djupa neurala nätverk för att lösa problemet. Faktum är att en av de viktigaste egenskaperna hos Alphafold är att det kodar den evolutionära historien av ett protein inuti det neurala nätverket, en idé som faktiskt härstammar här på LiU och publicerades av Björn och mig 2019. Så man kan säga att Alphafold byggde på vår idé, och nu bygger vi på Alphafold, säger Claudio Mirabello.
Studien finansierades i huvudsak av SciLifeLab, Knut och Alice Wallenbergs stiftelse samt Stiftelsen för strategisk forskning. Beräkningarna utfördes på superdatorerna Tetralith och Berzelius vid Nationellt superdatorcentrum vid Linköpings universitet.