Voorspellingen

Enkele jaren geleden was ik nog een echte nerd, in de lessen Datamining & Neurale Netwerken hield men ons bijvoorbeeld bezig met tijdsreeksen (“time series”). Zeer interessant: je krijgt een set datapunten ter beschikking, en je moet je neuraal netwerk “trainen” om dan op basis van een subset van die tijdsreeks het vervolg van de tijdsreeks te voorspellen, ofte “extrapoleren”.

Extrapoleren, dat is niet evident. In de lessen Numerieke Wiskunde (gegeven door een poetisch professor) hadden we geleerd over onstabiele methodes en slecht geconditioneerde problemen. [De professor zijn cursus schreef alles met een “k” in plaats van met een “c”.] Methodes gebruik je om problemen op te lossen. Als ik me niet vergis, is een methode stabiel als de fout op de output gelijkaardig blijft aan de fout op de input (bijvoorbeeld door ruis op de metingen). Een probleem is slecht geconditioneerd als onafhankelijk van welke methode je gebruikt, de fout op de uitkomst altijd groter zal zijn dan de fout die op de input zit. Welnu, voorspellen is een slecht geconditioneerd probleem.

Je denkt dat je subset het dal is van een parabool, en dan blijkt dat opeens een exponentiele functie te benaderen. Lastig!

En dan is er een site zoals de Overstromingsvoorspeller. Daar kan je op verschillende punten in het Vlaams waternetwerk kijken naar de voorspellingen van en de huidige waterstanden. Waterstanden zijn niet zo simpel als een parabool: dat gaat omhoog en omlaag zonder regelmaat. Een ijverige wiskundige zou er een spline van sinusoide functies op loslaten.

Voorspellingen en werkelijke waarden.

Voorspellingen en werkelijke waarden.

In stippellijn zie je hierboven de voorspellingen van het waterpeil, in volle blauwe lijn de werkelijke waarden. Wat valt er op?

Dat de timing van de pieken redelijk goed voorspeld werd (de start van de pieken zijn goed, de uiteindelijke pieken bleken 2-3 uur later), maar dat de werkelijke waarde nogal onderschat werd (een voorspelde piek van 11,7 m TAW blijkt 12,2 m TAW geworden te zijn, ofte 4,3% ernaast). 4,3% ernaast valt nog mee, maar een halve meter water kan wel het verschil betekenen tussen droge en natte meubels.