Key to reinforcement learning in multi-agent systems is the ability to exploit the fact that agents only directly influence only a small subset of the other agents. Such loose couplings are often modelled using a graphical model: a coordination graph. Finding an (approximately) optimal joint action for a given coordination graph is therefore a central subroutine in cooperative multi-agent reinforcement learning (MARL). Much research in MARL focuses on how to gradually update the parameters of the coordination graph, whilst leaving the solving of the coordination graph up to a known typically exact and generic subroutine. However, exact methods { e.g., Variable Elimination { do not scale well, and generic methods do not exploit the MARL setting of gradually updating a coordination graph and recomputing the joint action to select. In this paper, we examine what happens if we use a heuristic method, i.e., local search, to select joint actions in MARL, and whether we can use outcome of this local search from a previous time-step to speed up and improve local search. We show empirically that by using local search, we can scale up to many agents and complex coordination graphs, and that by reusing joint actions from the previous time-step to initialise local search, we can both improve the quality of the joint actions found and the speed with which these joint actions are found.
LINK
Artificially intelligent agents increasingly collaborate with humans in human-agent teams. Timely proactive sharing of relevant information within the team contributes to the overall team performance. This paper presents a machine learning approach to proactive communication in AI-agents using contextual factors. Proactive communication was learned in two consecutive experimental steps: (a) multi-agent team simulations to learn effective communicative behaviors, and (b) human-agent team experiments to refine communication suitable for a human team member. Results consist of proactive communication policies for communicating both beliefs and goals within human-agent teams. Agents learned to use minimal communication to improve team performance in simulation, while they learned more specific socially desirable behaviors in the human-agent team experiment
DOCUMENT
This paper describes an agent-based software infrastructure for agile industrial production. This production is done on special devices called equiplets. A grid of these equiplets connected by a fast network is capable of producing a variety of different products in parallel. The multi-agent-based underlying systems uses two kinds of agents: an agent representing the product and an agent representing the equiplet.
MULTIFILE
This chapter presents the currently not established and identifies design requirements for new systems to address this challenge and provide directions for possible improvement. As a result, this chapter introduces the concept of SamenMarkt®, a participatory system in which multi-agent system technology enables distributed price negotiation, distribution and communication between producers, retailers and consumers.
LINK
Athor supplied : "This paper describes an agent-based architecture for domotics. This architecture is based on requirements about expandability and hardware independence. The heart of the system is a multi-agent system. This system is distributed over several platforms to open the possibility to tie the agents directly to the actuators, sensors and devices involved. This way a level of abstraction is created and all intelligence of the system as a whole is related to the agents involved. A proof of concept has been built and functions as expected. By implementing real and simulated devices and an easy to use graphical interface, all kind of compositions can be studied using this platform."
DOCUMENT
This chapter gives an overview on the Healthy Ageing research portfolio of the research group Lifelong Learning in Music (Hanze University of Applied Sciences Groningen, the Netherlands). Lifelong learning enables musicians to respond to the continuously changing context in which they are working nowadays, and ageing is one of the major societal changes for many western societies in the 21st century. Musicians are asked by society to contribute to healthy ageing processes, and such a contribution in turn generates possibilities for innovative musical practices with the elderly. We present a three-layered model to look at such innovative practices, which places the musical practice itself in the context of communicative characteristics of working with elderly people and in broader societal and institutional contexts. We then outline four concrete research projects: learning to play an instrument at an elderly age, creative music workshops for elderly in residential home settings, the competencies of creative music workshop leaders working with frail elderly people, and musical work with severely ill elderly people in hospitals. We describe some background values and methodological notions behind our work, and finish the article with a more extensive description of our project on Music and Dementia.
DOCUMENT
To meet the care needs of the rapidly ageing patient populations, the cultivation of a compassionate patient-centred healthcare culture has become central in the value-based healthcare discourse. A participatory music practice, ‘Meaningful Music in Healthcare’ employs a person-centred approach to music-making in Dutch hospitals. A grounded theory analysis on ethnographically collected data suggests that music-making serves as a social change agent and cultural resource for catalysing compassionate contact between healthcare professionals and patients. Processes of experiential growth and shared values in music-making and healthcare help to enrich care relationships and allow the emotional dimension of nurses’ professional performance to be explored.
DOCUMENT
Om veel leerplezier mogelijk te maken is in september 2004 het Open Space Atelier van start gegaan, waarin door studenten, docenten en hun kinderen vrij gewerkt en met elkaar gesproken kan worden over ons boeiende vak: het onderwijs. Er is geen agenda of programma. De gebeurtenissen worden door de inbreng van de aanwezigen bepaald. In het Lectoraat Vernieuwende Opleidingsmethodiek en -didactiek onderzoeken we met lector Hans Jansen manieren van Levend Leren (in het kerstboekje dat Jan Brandsma ons cadeau deed, is over Levend Leren al veel te lezen: leren mag spannend, uitdagend en geïnspireerd als het leven zelf zijn). Deze onderzoeken verlopen op verschillende wijze: literatuurstudie, observatie en het toetsen van denkbeelden en theorie aan de praktijk. Een van de wegen om Levend Leren vorm te geven is het onderzoek naar de weg van Teacher-Directed Learning naar Self-Directed Learning en Free Agent Learning. Bij onze kenniskringdagen werken we met een open space aanpak. Dan verkennen we gezamenlijk creatieve en inspirerende wegen in ons eigen leerlandschap.
DOCUMENT
Dit proefschrift heeft als onderwerp de toepassing van agenttechnologie in productie en productondersteuning. Onder een agent verstaan we in deze context een autonoom opererende software entiteit die gemaakt is om een zeker doel te realiseren en daartoe met de omgeving comuniceert en zelfstandig acties kan uitvoeren. In moderne productiesystemen streeft men ernaar om de tijd van ontwerp tot productie zo kort mogelijk te houden en de productie af te stemmen op de wensen van de individuele eindgebruiker. Vooral dit laatste streven past niet in het concept van massaproductie. Een methode moet gezocht worden om kleine hoeveelheden of zelfs unieke producten tegen een lage kostprijs te fabriceren. Om dit te verwezenlijken zijn voor dit onderzoek speciale goedkope productieplatforms ontwikkeld. Deze hercongureerbare productiemachines noemen we equiplets. Een verzameling van deze equiplets in een gridopstelling geplaatst en gekoppeld met een snelle netwerkverbinding is in staat om een aantal verschillende producten tegelijk te produceren. Dit noemen we exibele parallelle productie. Voor de softwareinfrastructuur is agenttechnologie toegepast. Twee typen agenten spelen hierin een hoofdrol. Een productagent is verantwoordelijk voor de totstandkoming van een enkel product. De productiemachines worden voorgesteld door zogenoemde equipletagenten. De productagent weet wat er moet gebeuren voor het maken van een product terwijl de equipletagent weet hoe een of meer productiestappen moeten worden uitgevoerd. Het hier voorgesteld concept verschilt in veel opzichten van standaard massaproductie. Elk product in wording volgt zijn eigen, mogelijk unieke pad langs de equiplets, de productie wordt per product gescheduled en niet per batch en er is geen sprake van een productielijn. Dit proefschrift stelt de softwarearchitectuur voor en beschrijft oplossingen voor de routeplanning waarbij het aantal wisselingen tussen equiplets geminimaliseerd is, een scheduling die gebaseerd is op schedulingschema's zoals toegepast in real-time operating systems en een op autonome voertuigen gebaseerd transportsysteem. Bij al deze oplossingen speelt de productagent een belangrijke rol. (uit de samenvatting van het proefschrift) SIKS Dissertation Series No. 2014-31 The research reported in this thesis has been carried out under the auspices of SIKS, the Dutch Research School for Information and Knowledge Systems.
DOCUMENT
Why studying student agency? • Prepare students for lifelong learning. (Biesta & Tedder, 2007;OECD, 2018) • Agency fosters motivation, which could enhance performance. (Bandura, 2018; Ryan & Deci, 2020) • More flexibility in higher education, but not all students can handle this. (De Bruin & Verkoeijen, 2022; Van Casteren e.a., 2021)
DOCUMENT