Algoritm lär sig diagnostisera genetisk sjukdom

Genom att träna en algoritm med hjälp av patientdata har nu forskare vid Göteborgs universitet, tillsammans med forskare från Portugal, hittat ett sätt att uppskatta sannolikheten för om en patient lider av en vanlig genetisk sjukdom eller inte.

Forskare inom fysik och medicin från Göteborgs universitet, och från Nova Medical School i Lissabon, har samarbetat för att hitta ett sätt att använda maskininlärning för att diagnostisera patienter med förhöjda kolesterolnivåer.

Testat på vanlig sjukdom

Familial hypercholesterolemia (FH) är en vanlig genetisk sjukdom som drabbar en av 250 personer. Sjukdomen påverkar ämnesomsättningen och orsakar förhöjda kolesterolnivåer. För att få en helt säker diagnos krävs ett genetiskt test.

Dessa tester är emellertid bara tillgängliga på ett begränsat antal universitetssjukhus.

Alla andra sjukhus använder en metod som kallas Dutch lipid score, som baseras på en patients kliniska egenskaper och familjehistoria. Metoden uppskattar sannolikheten för att en patient lider av FH, snarare än att diagnostisera, och den är ett mer lättillgängligt, men mindre exakt, verktyg än ett genetiskt test.

Uppfunnit ny och mer tillförlitlig diagnosmetod

Nu har en tvärvetenskaplig grupp forskare från institutionen för fysik och avdelningen för molekylär och klinisk medicin vid Göteborgs universitet uppfunnit en alternativ metod.

–  Vi bestämde oss för att försöka använda maskininlärning för att förutsäga om en patient har den ärftliga genetiska sjukdomen, eller om deras symptom uppstått av orsaker relaterade till livsstil. För att göra detta använde vi tre olika typer av algoritmer: ett klassificeringsträd, en gradient boosting machine och ett neuralt nätverk. Vi fann att alla tre varianter gav bättre resultat än den traditionella Dutch lipid score, säger Saga Helgadottir, doktorand vid institutionen för fysik.

Använde data från patienter

Forskarna använde data från patienter i Göteborg för att träna algoritmerna. Hälften av datasetet användes för information, den andra hälften för att testa och se hur exakt algoritmerna kunde förutsäga om en patient led av FH eller inte.

För varje patient matades det in ett par grundläggande variabler, som alla sjukhus enkelt kunde få fram, som ålder och resultat från blodprov. Forskarna testade dessutom algoritmerna som tränats med Göteborgs-data på en annan uppsättning data från en liknande patientgrupp från Milano.

Resultaten visade att algoritmerna presterade mer exakt när de tränats med “lokalt data”, men algoritmernas resultat överträffade fortfarande Dutch lipid score när de testade extern Milano-data.

–  Beroende på hur väl du tränar algoritmen blir testresultatet mer eller mindre exakt. Sjukhus runt om i världen skulle kunna välja mellan att träna algoritmen med egen patientdata och få ett mer exakt resultat, eller att använda en redan tränad algoritm och fortfarande få ett bättre resultat än i dagsläget, säger Saga Helgadottir.

Jämföra data en väg framåt

Framöver kan en potentiell väg att utforska vara att träna algoritmen med hjälp av en stor mängd data från patientgrupper i olika länder, och jämföra exaktheten i resultaten med den för en version som tränats med endast lokala data.

–  Möjligheten att testa den idén hänger på tillgången till sådana datamängder, säger Saga Helgadottir.

Resultaten av studien har  publicerats i European Journal of Prevensive Cardiology.

Samarbetande forskare i studien inkluderar Stefano Romeo, professor i molekylär och klinisk medicin vid Göteborgs universitet och specialistläkare i kardiologi vid Sahlgrenska Universitetssjukhuset, Ana Pina, specialiserad läkare, datavetare och forskare vid Medir, Chronic Diseases Research Center, NovaMedical School och Giovanni Volpe, universitetslektor vid institutionen för fysik, Göteborgs universitet.