Completeness of data is vital for the decision making and forecasting on Building Management Systems (BMS) as missing data can result in biased decision making down the line. This study creates a guideline for imputing the gaps in BMS datasets by comparing four methods: K Nearest Neighbour algorithm (KNN), Recurrent Neural Network (RNN), Hot Deck (HD) and Last Observation Carried Forward (LOCF). The guideline contains the best method per gap size and scales of measurement. The four selected methods are from various backgrounds and are tested on a real BMS and metereological dataset. The focus of this paper is not to impute every cell as accurately as possible but to impute trends back into the missing data. The performance is characterised by a set of criteria in order to allow the user to choose the imputation method best suited for its needs. The criteria are: Variance Error (VE) and Root Mean Squared Error (RMSE). VE has been given more weight as its ability to evaluate the imputed trend is better than RMSE. From preliminary results, it was concluded that the best K‐values for KNN are 5 for the smallest gap and 100 for the larger gaps. Using a genetic algorithm the best RNN architecture for the purpose of this paper was determined to be GatedRecurrent Units (GRU). The comparison was performed using a different training dataset than the imputation dataset. The results show no consistent link between the difference in Kurtosis or Skewness and imputation performance. The results of the experiment concluded that RNN is best for interval data and HD is best for both nominal and ratio data. There was no single method that was best for all gap sizes as it was dependent on the data to be imputed.
MULTIFILE
Hoe overbruggen we de kloof tussen accountant en dataspecialist? Deel 2 van een drieluik over data-analyse. In een eerder artikel is de buitenste ring van het 'VTA-model toegelicht'. In dit vervolgartikel worden de twee binnenste ringen besproken.
DOCUMENT
Het project van Aeres Hogeschool Dronten heeft als doel om via het delen en analyseren van telersdata binnen een groep van dertien telers te komen tot nieuwe inzichten, betere bedrijfsvoering en efficiëntere ketens, gericht op economische en ecologische duurzaamheid. Hiervoor wordt een data-infrastructuur gerealiseerd waarmee telers gefaciliteerd worden in het verzamelen, delen en analyseren van data en toegang krijgen tot complexere analyse technieken. Het project beoogt een groep telers op te leiden om de infrastructuur en tools te gebruiken en gezamenlijk data te delen en te analyseren om de teelt te verbeteren. Aan het einde van het project worden concrete verbeteringen verwacht op het gebied van input en opbrengst in de aardappelteelt.Het project richtte zich op het onderzoeken van hoe data van agrarische ondernemers in Flevoland gebruikt en gedeeld kan worden om economische en ecologische verbeteringen te bereiken. De landbouwsector verzamelt steeds meer gegevens over variabelen die de groei en bewaring van gewassen beïnvloeden, waarmee de benadering van landbouw verduurzaamd kan worden. Echter, het gebruik van data staat nog in de kinderschoenen en beslissingen worden vaak genomen op basis van advisering van externe commerciële partijen. Het delen van data is ook nog gevoelige materie. Het project wil deze drempels verlagen door telers meer data onderling te laten uitwisselen en met partners in de keten.De data-infrastructuur wordt gerealiseerd voor een groep van 15-20 telers die bereid zijn teelt- en/of bewaarsturing te doen op basis van beschikbare object-specifieke en actuele data. De data kunnen met elkaar gedeeld worden en zo kunnen de bedrijven verbeterd worden. De telers krijgen via de infrastructuur toegang tot complexere analyse technieken. Het project is opgedeeld in drie groepen op basis van locatie in de provincie: een groep telers rond een pilot bedrijf in Dronten, een groep rond een pilot bedrijf in Swifterbant en een groep in de NOP.De drie pilot bedrijven hebben aan het begin van het project een inventarisatie gedaan op basis van een door Aeres opgestelde vragenlijst om inzicht te krijgen in de minimale beschikbare data voor deelname aan het project. De meeste gevraagde data zijn reeds beschikbaar, behalve bij het pilot bedrijf in de NOP. De ontbrekende data kunnen worden opgevraagd bij lokale weerstations of in het project door projectpartners worden gerealiseerd.In de agrarische sector komt het vaak voor dat er ontbrekende data zijn over de factoren die bijdragen aan mislukkingen in de precisielandbouw. Dit komt doordat er vaak wordt gedacht in termen van wat wel werkt, in plaats van wat niet werkt. Een manier om dit tegen te gaan is door bewust te zijn van de ontbrekende data en deze proactief op te zoeken. Dit kan bijvoorbeeld door onderzoek te doen naar de milieu-impact van landbouw.Door dit project is beter inzicht verkregen in de effectiviteit van inputs alsmede met betrekking tot de impact op de omgeving. De volgende verbeteringen zijn gerealiseerd:• Beter inzicht in timing van teelthandelingen waardoor de bodem wordt ontzien.• Beter inzicht in effecten van teeltrotaties waardoor gekozen kan worden voor rotaties met minder impact en toch goede financiële resultaten behaald worden.• Door vergelijking kan er effectiever omgegaan worden met inputs zoals mest en gewasbeschermingsmiddelen waardoor naast minder gebruik ook minder af- en uitspoeling zal plaatsvinden.• Door effectiever gebruik van inputs zal per kg geproduceerde aardappelen minder oppervlakte, energie en chemie nodig zijn.Trefwoorden: digitalisering boerenbedrijf, data, pop3, databoeren, precisielandbouw RVO zaaknummer: 17717000042
DOCUMENT
De balans tussen de belastbaarheid van sporters en de belasting moeten zo goed mogelijk afgestemd zijn om optimale trainingseffecten te realizeren. Er wordt onderscheid gemaakt tussen externe en interne trainingsbelasting, wat duidt op de belasting die extern of intern door de sporter wordt ervaren. Het sturen en bewaken van de balans wordt bij professionele sporters doorgaans verzorgd door (para)medische professionals en/of sportwetenschappers. Doordat er tegenwoordig vele manieren van test- en meettechnologie zijn om o.a. interne en externe belasting te meten is er een grote hoeveelheid aan data beschikbaar in de praktijk, waarvan het verwerken en analyseren arbeidsintensief is. Daarom is er vanuit de praktijk de behoefte om deze data snel inzichtelijk te maken. Vanuit het project is daarom een belastingsmonitor ontwikkeld o.b.v. big data technologieën. Het doel van dit rapport is een praktijkvalidatie van de belastingmonitor. Hierbij wordt enerzijds gekeken naar de verzamelde data door de praktijkpartners en anderzijds wordt onderzocht of veranderingen in ratio's tussen interne:externe belasting een valide manier is om veranderingen in fysieke fitheid te meten?Data door de praktijkpartners zijn op diverse manieren en voor diverse variabelen verzameld. De variabelen zijn onder te delen in de kopjes: (I) individuele kenmerken, (II) externe belasting, (III) interne belasting, (IV) herstel en (V) psychosociale stress. Doordat de diverse sportclubs variabelen verzamelen die zij van belang achten is het niet mogelijk geweest om 1 database op te stellen welke alle variabelen bevat. Hierin zou immers duidelijk moeten zijn wat per variabelen de definitie is, welke per sportclub kan verschillen. Voor toekomstige projecten is het wenselijk om hier uniformiteit in aan te brengen voor aanvang van het project. Dit zal eenvoudiger zijn naarmate ruwe data beschikbaar is, omdat het onwaarschijnlijk is dat de sportclubs hun definities aanpassen. De gebruikte meetinstrumenten en -methodes zijn voor het overgrote deel overeenkomstig uit de wetenschappelijke literatuur en tevens overeenkomstig met de wetenschappelijke standaard. Kanttekening is dat er voor dit rapport geen zicht is op de daadwerkelijke uitvoering van de betreffende metingen.De vraag of de veranderingen in ratio's tussen interne:externe belasting een valide manier is om veranderingen in fysieke fitheid te meten is beantwoord door gebruik te maken van een dataset van 1 voetbalclub (van 3 teams) over 2 seizoenen. Er gekeken of veranderingen in ratio's opgesteld uit diverse maten voor interne belasting (ervaren mate van inspanning en load) en externe belasting (totaal gelopen afstand en totaal gelopen afstand op hoge snelheid) met diverse tijdsintervallen een relatie vertoonden met veranderingen in fysieke fitheid, gemeten met gestandaardiseerde submaximale inspanningstesten. Uit de resultaten bleek dat er geen relatie is gevonden tussen vooraf genoemde variabelen. Er blijken diverse obstakels te zijn waardoor de verandering in ratio’s mogelijk niet correleren met de verandering in interne belasting tijdens fysieke testen. De belastingsmonitor kan dus niet gebruikt worden om fysieke fitheid van sporters inzichtelijk te maken wanneer gekeken wordt naar de opgestelde ratio’s tussen interne en externe belasting. Fysieke testen blijven hiervoor nog steeds noodzakelijk, omdat deze het beste beeld geven van de huidige fysieke fitheid van de sporters. De belastingsmonitor is daarom, voor nu, alleen geschikt voor het afzonderlijk inzichtelijk maken van de diverse variabelen uit de dataset.
DOCUMENT
Completeness of data is vital for the decision making and forecasting on Building Management Systems (BMS) as missing data can result in biased decision making down the line. This study creates a guideline for imputing the gaps in BMS datasets by comparing four methods: K Nearest Neighbour algorithm (KNN), Recurrent Neural Network (RNN), Hot Deck (HD) and Last Observation Carried Forward (LOCF). The guideline contains the best method per gap size and scales of measurement. The four selected methods are from various backgrounds and are tested on a real BMS and meteorological dataset. The focus of this paper is not to impute every cell as accurately as possible but to impute trends back into the missing data. The performance is characterised by a set of criteria in order to allow the user to choose the imputation method best suited for its needs. The criteria are: Variance Error (VE) and Root Mean Squared Error (RMSE). VE has been given more weight as its ability to evaluate the imputed trend is better than RMSE. From preliminary results, it was concluded that the best K‐values for KNN are 5 for the smallest gap and 100 for the larger gaps. Using a genetic algorithm the best RNN architecture for the purpose of this paper was determined to be Gated Recurrent Units (GRU). The comparison was performed using a different training dataset than the imputation dataset. The results show no consistent link between the difference in Kurtosis or Skewness and imputation performance. The results of the experiment concluded that RNN is best for interval data and HD is best for both nominal and ratio data. There was no single method that was best for all gap sizes as it was dependent on the data to be imputed.
DOCUMENT
Energysense is een dataverzamelings- en onderzoeksplatform terondersteuning van onderzoek naar de energietransitie. Sinds 2015worden meterstanden van deelnemende huishoudens verzameld. Hetbetreft gasmeterstanden per uur, en elektriciteitsmeterstanden(verbruik en teruglevering) per kwartier.
DOCUMENT
Inaugurele rede als Lector Precision Livestock Farming bij HAS hogeschool op 14 oktober 2016. PLF, in het Nederlands Precisielandbouw in de veehouderij, maakt gebruik van technologieën om diergedrag, diergezondheid, productie en milieubelasting continu te monitoren.
DOCUMENT
Quantified Self werd in 2007 geïntroduceerd als naam voor de mens die op zoek is naar persoonlijk betekenis uit persoonlijke data. Het is een beweging die sindsdien wereldwijd mensen bij elkaar brengt voor een dialoog over zelfkennis door getallen. In dit artikel wordt de zelfmetende mens geïntroduceerd en belicht vanuit verschillende perspectieven met als doel te duiden wat deze beweging kan betekenen voor de gezondheidszorg.
DOCUMENT
mHealth 24/7 is een dienst die diabetespatiënten helpt om op eenvoudige wijze toezicht te houden op hun eigen gezondheid. mDiabetes 24/7 is een prototype app binnen de dienst mHealth 24/7. Op dit moment kunnen patiënten met het prototype van de app hun bloedsuikerwaardes, een eetdagboek en de hoeveelheid toegediende insuline bijhouden. mHealth 24/7 heeft de wens geformuleerd om haar informatievoorziening aan diabetespatiënten verder uit te breiden, door gepersonaliseerd inzicht te geven in de oorzaak van stijgingen en dalingen van hun bloedsuikerwaarden. Meer informatie stelt de patiënt in staat om beter gemotiveerde maatregelen te nemen en stimuleert therapietrouw waarmee later complicaties kunnen worden voorkomen. Dit verbetert de kwaliteit van leven en vermindert kosten.In het project is gerealiseerd dat data uit een activity tracker en omgevingstemperatuur ingelezen wordt in de app en wordt geïntegreerd met bestaande data zoals bloedsuikerwaarde. Daarnaast kunnen patiënten handmatig aangeven hoe ze zich voelen. Patiënten krijgen daarmee inzicht in het effect van activiteit, omgevingstemperatuur en stemming op fluctuaties in bloedsuikerwaardes. In een pilot met 25 proefpersonen is de technische werking van de verrijkte app getest evenals de functionaliteit.Er is aangetoond dat de app werkt en dat voor gebruikers de verrijking van de informatie in de app met hartslag, omgevingstemperatuur en stemming van toegevoegde waarde is. Wel blijkt dat een app zoals deze foutloos en realtime moet werken en de gebruiksinterface dusdanig moet werken, dat de gebruikers er uitsluitend gemak van ondervinden. Diabetes is een arbeidsintensieve ziekte en nog meer werk is ongewenst!Als in een volgende pilot meer data kan worden verzameld, kan worden gewerkt aan het voorspellen van fluctuaties in bloedsuikerwaardes waardoor een patiënt ook voortijdig gewaarschuwd kan worden.Vanuit verschillende marktpartijen zoals ziekenhuizen en zorgverzekeraars is interesse getoond voor het project. Gezamenlijk gaan deze partijen aanspraak doen op tijdelijke financiering vanuit de “Beleidsregel Innovatie Kleinschalige Experimenten.
DOCUMENT
Melkveehouders beschikken over alsmaar meer data van hun dieren. De uitdaging is om die datastromen op de juiste manier te gebruiken. Het lijkt erop dat de crux zit in het combineren van verschillende gegevens.
DOCUMENT