Artificial Intelligence (AI) is een veelbelovende techniek binnen de KIA Sleuteltechnologieën. Met name generatieve AI (GenAI), bekend van ChatGPT, heeft de potentie om de uitvoering van beroepstaken fundamenteel te veranderen. Zo ook de beroepstaken van programmeurs en dataspecialisten. Aan de hand van een casus gaan we onderzoeken hoe de toepassing van GenAI voor dataconversie in de topsector Life Sciences kan leiden tot een versnelling in de ontwikkeling van geneesmiddelen en medische hulpmiddelen.
Het ontwikkelen van nieuwe geneesmiddelen en medische hulpmiddelen vraagt namelijk om een intensief regime van klinische studies om veiligheid en effectiviteit te waarborgen. Na elke studie dienen de resultaten en onderliggende klinische data ter goedkeuring ingediend te worden bij regelgevende instanties, een tijdrovend en kostbaar proces. Hierdoor duurt het voor patiënten lang voordat nieuwe medicijnen of medische hulpmiddelen beschikbaar zijn. Voor MKB-bedrijven die vaak maar één of enkele producten ontwikkelen kan de duur van het proces het verschil maken tussen wel of niet levensvatbaar zijn als bedrijf.
Een belangrijke bottleneck in het proces is dat het veel tijd kost om de data van de klinische studies te laten voldoen aan CDISC, een vereiste standaard voor data-aanlevering. De huidige werkwijze is dat de conversie van de data handmatig geprogrammeerd wordt. Het programmeren kost al snel honderden uren, hetgeen de doorlooptijd van studies significant verlengt.
Daarom wil dit consortium van Hanzehogeschool en drie mkb’s onderzoek doen naar de vraag: Hoe kunnen klinische data binnen de kaders van de regelgeving efficiënter geconverteerd worden naar CDISC-formaat door inzet van generatieve AI?
Naast de consortiumpartners zijn twee brancheorganisaties uit het domein Gezondheid en Zorg betrokken voor de disseminatie binnen de Life Sciences. Deze brancheorganisaties zijn tevens de eerste partij voor opschaling in vervolgprojecten. De Hanzehogeschool zorgt verder voor de transfer van de opgedane kennis naar andere data-intensieve domeinen.