Einführung in Datasciense Teil 1: Die Basics

 
 
 
 
hard-drive-611514_960_720.jpg

Computer lernen über Algorithmen. Die Algorithmen wiederum nutzen wir, um den Computern z.B. die Unterscheidung von Gangarten beizubringen. Um diese zu erstellen, werden Daten benötigt, die ein Event – in unserem Falle die Bewegung des Pferdes in einer bestimmten Gangart – darstellen. Diese Daten müssen bestimmte Eigenschaften aufweisen. 

 
 

Eigenschaften der Daten für Bewegungs-Algorithmen

1. Anzahl der Messungen pro Sekunde

Wichtig ist die optimale Anzahl an Messpunkten pro Zeiteinheit. Um eine zu geringe Datenanzahl zu vermeiden, haben wir zunächst 20 Messungen pro Sekunde (!) vorgenommen. Vor dem Verwerten der Daten im Algorithmus muss man jedoch die überschüssigen Messungen herausfiltern. Hier steigen wir dann schon richtig in den Bereich „Datascience“ ein.


2. Was hat man überhaupt aufgenommen? 

Die Klassifizierung: Handelt es sich z.B. um eine Aufzeichnung im Schritt, Trab oder Galopp? Und gibt es unbrauchbare Daten, zum Beispiel zu Beginn oder Ende einer Aufnahme?
Wie es zu diesen unbrauchbaren Datenschnipseln kommt und wie wir versucht haben klassifizierte Daten zu sammeln, könnt ihr im zweiten Teil dieser Serie nachlesen. 


3. Die Daten müssen vom Aufnahmegerät zu unserem Rechenzentrum

In unserem Fall ist dieses Rechenzentrum ein Backend in der Microsoft Cloud. Die Daten müssen dabei vollständig übertragen werden. Im Stall ist dabei der schlechte Empfang durch eine vorherige Speicherung der Daten auf dem Smartphone zu überbrücken. So können Daten auch später noch übertragen werden.


 

Weitere spannende Informationen findest du hier

Einführung in Data Science Teil 2: Daten richtig erfassen

 
Enri Strobel