The platform for open and practice-oriented research

Products 73

product

Automatic categorization of self-acknowledged limitations in randomized controlled trial publications

Objective:Acknowledging study limitations in a scientific publication is a crucial element in scientific transparency and progress. However, limitation reporting is often inadequate. Natural language processing (NLP) methods could support automated reporting checks, improving research transparency. In this study, our objective was to develop a dataset and NLP methods to detect and categorize self-acknowledged limitations (e.g., sample size, blinding) reported in randomized controlled trial (RCT) publications.Methods:We created a data model of limitation types in RCT studies and annotated a corpus of 200 full-text RCT publications using this data model. We fine-tuned BERT-based sentence classification models to recognize the limitation sentences and their types. To address the small size of the annotated corpus, we experimented with data augmentation approaches, including Easy Data Augmentation (EDA) and Prompt-Based Data Augmentation (PromDA). We applied the best-performing model to a set of about 12K RCT publications to characterize self-acknowledged limitations at larger scale.Results:Our data model consists of 15 categories and 24 sub-categories (e.g., Population and its sub-category DiagnosticCriteria). We annotated 1090 instances of limitation types in 952 sentences (4.8 limitation sentences and 5.5 limitation types per article). A fine-tuned PubMedBERT model for limitation sentence classification improved upon our earlier model by about 1.5 absolute percentage points in F1 score (0.821 vs. 0.8) with statistical significance (). Our best-performing limitation type classification model, PubMedBERT fine-tuning with PromDA (Output View), achieved an F1 score of 0.7, improving upon the vanilla PubMedBERT model by 2.7 percentage points, with statistical significance ().Conclusion:The model could support automated screening tools which can be used by journals to draw the authors’ attention to reporting issues. Automatic extraction of limitations from RCT publications could benefit peer review and evidence synthesis, and support advanced methods to search and aggregate the evidence from the clinical trial literature.

MULTIFILE

Automatic categorization of self-acknowledged limitations in randomized controlled trial publications

product

The application of natural language processing for the extraction of mechanistic information in toxicology

To study the ways in which compounds can induce adverse effects, toxicologists have been constructing Adverse Outcome Pathways (AOPs). An AOP can be considered as a pragmatic tool to capture and visualize mechanisms underlying different types of toxicity inflicted by any kind of stressor, and describes the interactions between key entities that lead to the adverse outcome on multiple biological levels of organization. The construction or optimization of an AOP is a labor intensive process, which currently depends on the manual search, collection, reviewing and synthesis of available scientific literature. This process could however be largely facilitated using Natural Language Processing (NLP) to extract information contained in scientific literature in a systematic, objective, and rapid manner that would lead to greater accuracy and reproducibility. This would support researchers to invest their expertise in the substantive assessment of the AOPs by replacing the time spent on evidence gathering by a critical review of the data extracted by NLP. As case examples, we selected two frequent adversities observed in the liver: namely, cholestasis and steatosis denoting accumulation of bile and lipid, respectively. We used deep learning language models to recognize entities of interest in text and establish causal relationships between them. We demonstrate how an NLP pipeline combining Named Entity Recognition and a simple rules-based relationship extraction model helps screen compounds related to liver adversities in the literature, but also extract mechanistic information for how such adversities develop, from the molecular to the organismal level. Finally, we provide some perspectives opened by the recent progress in Large Language Models and how these could be used in the future. We propose this work brings two main contributions: 1) a proof-of-concept that NLP can support the extraction of information from text for modern toxicology and 2) a template open-source model for recognition of toxicological entities and extraction of their relationships. All resources are openly accessible via GitHub (https://github.com/ontox-project/en-tox).

PDF

The application of natural language processing for the extraction of mechanistic information in toxicology

product

Sentiment polarity classification of corporate review data with a bidirectional Long-Short Term Memory (biLSTM) neural network architecture

A considerable amount of literature has been published on Corporate Reputation, Branding and Brand Image. These studies are extensive and focus particularly on questionnaires and statistical analysis. Although extensive research has been carried out, no single study was found which attempted to predict corporate reputation performance based on data collected from media sources. To perform this task, a biLSTM Neural Network extended with attention mechanism was utilized. The advantages of this architecture are that it obtains excellent performance for NLP tasks. The state-of-the-art designed model achieves highly competitive results, F1 scores around 72%, accuracy of 92% and loss around 20%.

PDF

Sentiment polarity classification of corporate review data with a bidirectional Long-Short Term Memory (biLSTM) neural network architecture

People 1

person

Jenia Kim

Onderzoeker

Projects 7

project

AI-enhanced Data Analysis

Developing a framework that integrates Advanced Language Models into the qualitative research process.Qualitative research, vital for understanding complex phenomena, is often limited by labour-intensive data collection, transcription, and analysis processes. This hinders scalability, accessibility, and efficiency in both academic and industry contexts. As a result, insights are often delayed or incomplete, impacting decision-making, policy development, and innovation. The lack of tools to enhance accuracy and reduce human error exacerbates these challenges, particularly for projects requiring large datasets or quick iterations. Addressing these inefficiencies through AI-driven solutions like AIDA can empower researchers, enhance outcomes, and make qualitative research more inclusive, impactful, and efficient.The AIDA project enhances qualitative research by integrating AI technologies to streamline transcription, coding, and analysis processes. This innovation enables researchers to analyse larger datasets with greater efficiency and accuracy, providing faster and more comprehensive insights. By reducing manual effort and human error, AIDA empowers organisations to make informed decisions and implement evidence-based policies more effectively. Its scalability supports diverse societal and industry applications, from healthcare to market research, fostering innovation and addressing complex challenges. Ultimately, AIDA contributes to improving research quality, accessibility, and societal relevance, driving advancements across multiple sectors.

Ongoing

project

Automatische nieuwsredactie

Aanleiding Nieuwsuitgeverijen bevinden zich in zwaar weer. Economische malaise en toegenomen concurrentie in het pluriforme medialandschap dwingen uitgeverijen om enerzijds kosten te besparen en tegelijkertijd te investeren in innovatie. De verdere automatisering van de nieuwsredactie vormt hierbij een uitdaging. Buiten de branche ontstaan technieken die uitgeverijen hierbij zouden kunnen gebruiken. Deze zijn nog niet 'vertaald' naar gebruiksvriendelijke systemen voor redactieprocessen. De deelnemers aan het project formuleren voor dit braakliggend terrein een praktijkgericht onderzoek. Doelstelling Dit onderzoek wil antwoord geven op de vraag: Hoe kunnen bewezen en nieuw te ontwikkelen technieken uit het domein van 'natural language processing' een bijdrage leveren aan de automatisering van een nieuwsredactie en het journalistieke product? 'Natural language processing' - het automatisch genereren van taal - is het onderwerp van het onderzoek. In het werkveld staat deze ontwikkeling bekend als 'automated journalism' of 'robotjournalistiek'. Het onderzoek richt zich enerzijds op ontwikkeling van algoritmes ('robots') en anderzijds op de impact van deze technologische ontwikkelingen op het nieuwsveld. De impact wordt onderzocht uit zowel het perspectief van de journalist als de nieuwsconsument. De projectdeelnemers ontwikkelen binnen dit onderzoek twee prototypes die samen het automated-journalismsysteem vormen. Dit systeem gaat tijdens en na het project gebruikt worden door onderzoekers, journalisten, docenten en studenten. Beoogde resultaten Het concrete resultaat van het project is een prototype van een geautomatiseerd redactiesysteem. Verder levert het project inzicht op in de verankering van dit soort systemen binnen een nieuwsredactie. Het onderzoek biedt een nieuw perspectief op de manier waarop de nieuwsconsument de ontwikkeling van 'automated journalism' in Nederland waardeert. Het projectteam deelt de onderzoekresultaten door middel van presentaties voor de uitgeverijbranche, presentaties op wetenschappelijke conferenties, publicaties in (vak)tijdschriften, reflectiebijeenkomsten met collega-opleidingen en een samenvattende white paper.

Finished

project

Nationaal Lectoren Platform Urban Energy (NLP-UE)

Met de start van het Nationaal Lectoren Platform Urban Energy (NL UE), ontstond een unieke nationale onderzoeksgroep voor toegepast onderzoek op het domein Urban Energy. Onze stip op de horizon, de realisatie van Netto energie neutrale steden in 2050, past bij het belang van hogescholen in de regio, de Regionale Energie Strategie (RES) en de wijkgerichte aanpak. De afgelopen jaren werkten we aan een gezamenlijke onderzoeksagenda, organiseerden, een studentenwedstrijd (Zero Energy Award) en deelden we kennis in 16 bijeenkomsten. Een website is ontwikkeld en online gezet (www.nlurbanenergy.nl). De komende jaren zetten we ons in voor: 1. De gezamenlijke onderzoeksagenda (afstemming binnen het platform en met anderen); 2. Uitwisseling van kennis en (nationale) actuele informatie tussen de lectoraten onderling; 3. Fieldlabs Urban Energy ontwikkelen in elke stad waar het platform vertegenwoordigd is; 4. Jaarlijks een conferentie, met demonstratie van onze projecten; 5. Profilering en positionering van toegepast onderzoek in de Nederlandse kennisinfrastructuur; 6. De samenwerking met LEVE, door profilering op de conferentie met impact van het hbo. We verwachten dat we met onze activiteiten op het domein van Urban Energy het praktijkgericht onderzoek van de Universities of Applied Sciences beter toegankelijk en de impact beter zichtbaar kunnen maken. De jaarlijkse conferentie is de plek waar we resultaten presenteren en delen met onze (inter)nationale omgeving. In de fieldlabs doen we dat voor onze regio en vergroten we de toegankelijkheid voor onze directe omgeving. De website ondersteunt dit heel laagdrempelig. Met het lectorenplatform Urban Energy versterken we met onze expertise de energietransitie in Nederland, dragen we bij aan de RES en wijkgerichte aanpak en versterken we de kennispositie van de hogescholen met directe impact in het praktijkgericht onderwijs en de beroepspraktijk.

Finished

project

Nederlands Lectoren Platform Ondernemerschap

Met deze platformaanvraag spelen we in op de gevoelde noodzaak en zoektocht binnen de regio's van de betrokken hogescholen naar manieren om de koers van het mkb richting brede welvaart te versnellen en op te schalen. Dit doen we middels een expliciete proces- en gedragsbenadering van ondernemerschap waarbij we gericht het bestaande ondernemerschapsonderzoek doorontwikkelen en gezamenlijk ontsluiten richting de praktijk. In deze gedrags- en procesgerichte betekenis ligt de nadruk op ondernemerschap als ‘waardecreatieproces’: het zien, creëren, evalueren en benutten van kansen . Ondernemerschap is vanuit die optiek een voertuig voor het proactief verkennen, oppakken, versnellen en opschalen van oplossingsrichtingen rondom verduurzaming, inclusie, digitalisering en nieuwe technologieën. Dat is een wezenlijk andere benadering dan de relatief smalle focus op het starten en/of groeien van nieuwe bedrijven (via “startups” en “scale ups”). Deze bredere kijk op ondernemerschap is essentieel, omdat ondernemend gedrag steeds belangrijker wordt voor zowel studenten, die worden gezien als regionale 'changemakers', als voor de vele kleine en middelgrote (familie)bedrijven die hun ondernemerschap in de regio opnieuw moeten uitvinden. Beide groepen zijn daarbij afhankelijk van het regionale ecosysteem. De verbinding tussen enerzijds de kennis en netwerken rondom een proces- en gedragsbenadering van ondernemerschap en anderzijds het inzetten van die kennis en netwerken ten behoeve van de transitieopgaven, landelijk en in de regio’s, gebeurt nog onvoldoende. Met deze platformaanvraag kan het Nederlands Lectoren Platform Ondernemerschap (NLPO) deze stap zetten. Daarvoor zijn een aantal specifieke doelen gesteld: 1. Het bundelen en verspreiden van relevante kennis over ondernemerschap; 2. Het bevorderen van samenwerking en uitwisseling van kennis over en ervaring met doorwerking van praktijkgericht ondernemerschapsonderzoek; 3. Thematisch bijeenbrengen van onderzoekers in special interest groups; 4. Het vergroten van de impact van eerder onderzoek. Daarvoor bouwen we voort op de basis die reeds is neergezet door het NLPO en verbinden we nieuwe (regionale) stakeholders.

Ongoing

project

Taalmaken als katalysator voor duurzame businessmodellen: een gedragen systemisch-contextuele aanpak

Veel MKB-organisaties worstelen met het omschakelen naar duurzame businessmodels. Deze duurzame businessmodellen zijn een essentieel onderdeel bij het adresseren van complexe maatschappelijke uitdagingen. Vanuit verschillende disciplines is een groeiende vraag ontstaan naar specifieke instrumenten en praktische kennis om organisaties te ondersteunen bij deze transitie. Intermediairs spelen een belangrijke rol in dit verduurzamingsproces waarbij diverse tools ingezet worden om de complexiteit te beheersen. Taal en context hebben grote invloed op het effectief werken met deze businessmodeltools en daarmee ook op het behalen van de duurzaamheidsdoelstellingen. Dit project onderzoekt daarom de invloed van taal en context op het gebruik van duurzame businessmodeltools door intermediairs. Specifiek richt dit project zich op het verbeteren van de adviseringsprocessen en het toolinggebruik bij twee changemakers, Eshuis Accountants en Adviseurs en De Betekenisfabriek, met als doel om de opgedane kennis en kunde breed te delen en de duurzame transitie te versnellen. Advanced datasciencetechnieken als Natural Language Processing (NLP) en Machine Learning worden ingezet om nieuwe inzichten te verkrijgen over de rol van taal en context bij het inzetten van duurzame businessmodeltools. De resultaten van het onderzoek worden gebruikt om een datagedreven interdisciplinaire toolkit te ontwikkelen voor zowel adviseurs als MKB’s. De resultaten dragen bij aan het ontwikkelen van trainingsmateriaal waarmee organisaties ondersteund kunnen worden in hun duurzaamheidstransities. Deze taal-en contextsensitieve toolkit zal breed gedeeld worden binnen onze Impact Ondernemen Collegetour Community waar ongeveer 80 organisaties aan meedoen. Daarnaast geeft dit project via de beoogde toolkit de aanzet voor het verkennen van de veranderende rol van organisatieadviseurs door datagedreven werken te combineren met duurzaamheidsopgaven. De overkoepelende projectdoelstelling is een praktische bijdrage te leveren aan het ondersteunen van organisaties in hun duurzaamheidstransitie en de onderlinge samenwerking te bevorderen, waarmee dit project bijdraagt aan zowel structurele maatschappelijke transities als marktcreatie.

Ongoing

Products 73

product

Automatic categorization of self-acknowledged limitations in randomized controlled trial publications

MULTIFILE

product

The application of natural language processing for the extraction of mechanistic information in toxicology

PDF

product

Sentiment polarity classification of corporate review data with a bidirectional Long-Short Term Memory (biLSTM) neural network architecture

PDF