0317 42 17 11 Mail ons

Geografische data mining en business intelligence

Ga je meer zien door te voorspellen?

Je hebt honderdduizenden gegevens in je database. Big data zou je kunnen zeggen. Maar als je deze data niet goed kunt bevragen, brengt het je nog geen informatie. Alsof je rijk bent maar je niks met je geld kunt doen.

Business Intelligence for nature

De statistische gegevens op zich zijn al wetenswaardig voor bijvoorbeeld natuurbeleid. Maar voor de gebruikers is het zeker ook interessant om op basis van de waarnemingen te kunnen voorspellen wat je nog aan andere waarnemingen kunt verwachten. Dat kun je doen als je weet dat bepaalde soorten meestal gezamenlijk voorkomen in een gebied.

Simpel gezegd: waar je eekhoorns aantreft vind je ook (noten-)bomen maar waarschijnlijk ook hun natuurlijke vijanden marters, roofvogels en katten.

Om hier achter te komen moet je relaties leggen tussen de data (pre-processen van de gegevens) en zoeken naar samenlevingspatronen op grond van dezelfde plaats en tijd. Daarvoor bestaan Business Intelligence tools die Maxime Tijdink in dit proof of concept succesvol heeft ingezet.

Business Intelligence (BI)

 

"het verzamelen van gegevens binnen de eigen handelingsactiviteit:
een proces van gegevens omzetten in informatie,
die vervolgens leidt tot kennis en aanzetten tot adequate actie."

Waarneming.nl

Bovenstaande is in bepaalde mate van toepassing op de data van Waarneming.nl. Op deze site voeren meer dan 70.000 geregistreerde gebruikers hun waarnemingen over planten en dieren in het veld in. Al jaren lang. Dat levert een immense hoeveelheid ruimtelijke gegevens op en een schat aan informatie als je verbanden tussen de gegevens kunt leggen.

Maxime Tijdink heeft grote interesse in de mogelijkheden van data mining. Hij pakte de handschoen op en ging de data van Waarneming.nl te lijf. In zijn afstudeerstage voor zijn opleiding Bioinformatics aan de Wageningen University omschreef hij deze uitdaging als volgt:

  • Op welke manieren kunnen de gegevens van waarneming.nl duidelijker en eenvoudiger gepresenteerd worden voor de eindgebruikers?
  • Wat kan er worden verbeterd aan de huidige ruimtelijke presentatie en statistische inzichten op waarneming.nl?
  • Hoe kunnen we door gebruik te maken van BI-tools op basis van een ruimtelijke analyse van de data, voorspellen dat bepaalde waarnemingen mogelijk zijn?

Data Mining

"het zoeken naar statistische verbanden en het graven naar iets waardevols"

Geografische en statistische presentatie

Tijdens zijn internship bij Nieuwland Geo-informatie werkte Maxime met WebGIS Publisher. In een Proof of Concept maakte hij een kaart met alle waarnemingen in een bepaald gebied in een bepaalde periode. De waarnemingen worden in een apart venster statistisch weergegeven, opgedeeld in verschillende taxonomische niveaus van groepen, familie en soorten. Maxime bedacht verschillende presentatievormen; een kolomgrafiek, een lijndiagram en een zoomable zonnestraal plot. De kleuren komen overeen met de kleuren van de presentatie op de kaart.

Focus

Als je weet waarop je moet letten, kun je sterker focussen. We kennen het allemaal: als we een andere auto willen kopen en we hebben een bepaald merk en type in gedachten, dan zien we die auto vaker rijden. Zo kun je op zoek gaan naar de Erithacus rubecula omdat je weet dat de Parus major al is waargenomen.

En die ga je vermoedelijk dan ook eerder spotten. Mooi toch?

Meer weten over de mogelijkheden van WebGIS Publisher? Lees verder.

DEMONSTRATIE

Spring naar de toolbar