Preprint submitted to Information Processing & Management Tags are a convenient way to label resources on the web. An interesting question is whether one can determine the semantic meaning of tags in the absence of some predefined formal structure like a thesaurus. Many authors have used the usage data for tags to find their emergent semantics. Here, we argue that the semantics of tags can be captured by comparing the contexts in which tags appear. We give an approach to operationalizing this idea by defining what we call paradigmatic similarity: computing co-occurrence distributions of tags with tags in the same context, and comparing tags using information theoretic similarity measures of these distributions, mostly the Jensen-Shannon divergence. In experiments with three different tagged data collections we study its behavior and compare it to other distance measures. For some tasks, like terminology mapping or clustering, the paradigmatic similarity seems to give better results than similarity measures based on the co-occurrence of the documents or other resources that the tags are associated to. We argue that paradigmatic similarity, is superior to other distance measures, if agreement on topics (as opposed to style, register or language etc.), is the most important criterion, and the main differences between the tagged elements in the data set correspond to different topics
Editorial on the Research Topic "Leveraging artificial intelligence and open science for toxicological risk assessment"
LINK
The main goal of this study was to investigate if a computational analyses of text data from the National Student Survey (NSS) can add value to the existing, manual analysis. The results showed the computational analysis of the texts from the open questions of the NSS contain information which enriches the results of standard quantitative analysis of the NSS.
Aanleiding Nieuwsuitgeverijen bevinden zich in zwaar weer. Economische malaise en toegenomen concurrentie in het pluriforme medialandschap dwingen uitgeverijen om enerzijds kosten te besparen en tegelijkertijd te investeren in innovatie. De verdere automatisering van de nieuwsredactie vormt hierbij een uitdaging. Buiten de branche ontstaan technieken die uitgeverijen hierbij zouden kunnen gebruiken. Deze zijn nog niet 'vertaald' naar gebruiksvriendelijke systemen voor redactieprocessen. De deelnemers aan het project formuleren voor dit braakliggend terrein een praktijkgericht onderzoek. Doelstelling Dit onderzoek wil antwoord geven op de vraag: Hoe kunnen bewezen en nieuw te ontwikkelen technieken uit het domein van 'natural language processing' een bijdrage leveren aan de automatisering van een nieuwsredactie en het journalistieke product? 'Natural language processing' - het automatisch genereren van taal - is het onderwerp van het onderzoek. In het werkveld staat deze ontwikkeling bekend als 'automated journalism' of 'robotjournalistiek'. Het onderzoek richt zich enerzijds op ontwikkeling van algoritmes ('robots') en anderzijds op de impact van deze technologische ontwikkelingen op het nieuwsveld. De impact wordt onderzocht uit zowel het perspectief van de journalist als de nieuwsconsument. De projectdeelnemers ontwikkelen binnen dit onderzoek twee prototypes die samen het automated-journalismsysteem vormen. Dit systeem gaat tijdens en na het project gebruikt worden door onderzoekers, journalisten, docenten en studenten. Beoogde resultaten Het concrete resultaat van het project is een prototype van een geautomatiseerd redactiesysteem. Verder levert het project inzicht op in de verankering van dit soort systemen binnen een nieuwsredactie. Het onderzoek biedt een nieuw perspectief op de manier waarop de nieuwsconsument de ontwikkeling van 'automated journalism' in Nederland waardeert. Het projectteam deelt de onderzoekresultaten door middel van presentaties voor de uitgeverijbranche, presentaties op wetenschappelijke conferenties, publicaties in (vak)tijdschriften, reflectiebijeenkomsten met collega-opleidingen en een samenvattende white paper.
Veel MKB-organisaties worstelen met het omschakelen naar duurzame businessmodels. Deze duurzame businessmodellen zijn een essentieel onderdeel bij het adresseren van complexe maatschappelijke uitdagingen. Vanuit verschillende disciplines is een groeiende vraag ontstaan naar specifieke instrumenten en praktische kennis om organisaties te ondersteunen bij deze transitie. Intermediairs spelen een belangrijke rol in dit verduurzamingsproces waarbij diverse tools ingezet worden om de complexiteit te beheersen. Taal en context hebben grote invloed op het effectief werken met deze businessmodeltools en daarmee ook op het behalen van de duurzaamheidsdoelstellingen. Dit project onderzoekt daarom de invloed van taal en context op het gebruik van duurzame businessmodeltools door intermediairs. Specifiek richt dit project zich op het verbeteren van de adviseringsprocessen en het toolinggebruik bij twee changemakers, Eshuis Accountants en Adviseurs en De Betekenisfabriek, met als doel om de opgedane kennis en kunde breed te delen en de duurzame transitie te versnellen. Advanced datasciencetechnieken als Natural Language Processing (NLP) en Machine Learning worden ingezet om nieuwe inzichten te verkrijgen over de rol van taal en context bij het inzetten van duurzame businessmodeltools. De resultaten van het onderzoek worden gebruikt om een datagedreven interdisciplinaire toolkit te ontwikkelen voor zowel adviseurs als MKB’s. De resultaten dragen bij aan het ontwikkelen van trainingsmateriaal waarmee organisaties ondersteund kunnen worden in hun duurzaamheidstransities. Deze taal-en contextsensitieve toolkit zal breed gedeeld worden binnen onze Impact Ondernemen Collegetour Community waar ongeveer 80 organisaties aan meedoen. Daarnaast geeft dit project via de beoogde toolkit de aanzet voor het verkennen van de veranderende rol van organisatieadviseurs door datagedreven werken te combineren met duurzaamheidsopgaven. De overkoepelende projectdoelstelling is een praktische bijdrage te leveren aan het ondersteunen van organisaties in hun duurzaamheidstransitie en de onderlinge samenwerking te bevorderen, waarmee dit project bijdraagt aan zowel structurele maatschappelijke transities als marktcreatie.