Wat doet een Data Scientist?

Wat doet een ...? – 10 Nov 2020 door Fons Vaneker

De Data Scientist voorspelt klantgedrag met behulp van de data die een financiële dienstverlener voorhanden heeft. Of beter gezegd: hij programmeert algoritmen om dit te doen, met behulp van Machine Learning. In deze blog gaan we verder in op de werkzaamheden van de Data Scientist.

Wat doet een Data Scientist?

De Data Scientist bouwt datamodellen die voorspellen hoe klanten, klantgroepen en markten zich gaan gedragen. Om deze voorspelling te kunnen doen doorloopt hij een aantal stappen:

  • Probleem vaststellen;
  • Selecteren relevante data;
  • Incorrecte datawaarden corrigeren;
  • Data transformeren;
  • Datamining;
  • Datamodel maken;
  • Data visualiseren.

Probleem vaststellen

Een collega uit de Business klopt bij de afdeling Data Science aan met een vraag. De Data Scientist doet een uitgebreide uitvraag. Om te voorkomen dat er een ander probleem wordt opgelost dan is aangedragen.

Selecteren relevante data

Financiële dienstverleners verzamelen heel veel data. De Data Scientist is wat dat betreft een kind in een snoepwinkel. Maar niet alle data is relevant om het voorgelegde probleem op te lossen. En dus maakt hij een selectie.

Incorrecte datawaarden corrigeren

Data is heden ten dage nog voor een groot gedeelte mensenwerk. Kortom: ontbrekende waarden of incorrecte waarden zijn er in iedere databron. De Data Scientist trekt de datakwaliteit gelijk.

Data transformeren

Eenheden zijn niet in alle bronnen op dezelfde wijze vastgelegd. De betekenis is gelijk voor een mens van vlees en bloed, maar een machine weet dit niet. Bijvoorbeeld: in bron 1 is Jan 180 centimeter, in bron 2 is hij 1 meter 80. De Data Scientist uniformeert de gebruikte eenheden.

Datamining

De data is nu klaar om geanalyseerd te worden. De Data Scientist doet dit aan de hand van algoritmen met behulp van machine learning. Volledig automatisch dus.

Datamodel maken

Alle data is geanalyseerd. De Data Scientist kan nu een model maken die geïmplementeerd kan worden in dagelijkse business.

Data visualiseren

Een dashboard maakt data inzichtelijk en begrijpelijk voor iedereen die geen dataprofessional is. Visualisatie is essentieel om het eindresultaat te presenteren aan het management.

Wat is het verschil tussen Data Scientist en Data Analist?

In de praktijk worden de functies Data Scientist en Data Analist veelal door elkaar gebruikt. Maar er zijn wel degelijk verschillen. Een Data Scientist is vooral bezig met voorspellingen. Bijvoorbeeld over het toekomstige gedrag van een bepaald type klant. Een Data Analist houdt zich bezig met het inzichtelijk maken van huidig klantgedrag. Maar het grootste verschil is dat de Data Scientist zijn analyse maakt met behulp van Machine Learning. Vaak is de hoeveelheid data groter. Big data dus.

Wat is de rol van datamodellen?

Een dataset moet groot genoeg zijn om gedegen conclusies te kunnen trekken. Data Scientists gebruiken datasets die zo groot zijn dat deze conclusies alleen tot stand kunnen komen met behulp van een gedegen geautomatiseerd datamodel. Een Data Scientist bouwt zelf datamodellen. Eén van de voornaamste verschillen met het werk van Data Engineers, Data Analisten en Datamodel Analisten hierbij is dat de Scientist zoekt naar nieuwe datarelaties die eerder nog niet gelegd zijn. De Data Scientist is de innovator van het datagedreven werken. Out-of-the-box denken is daarom meer van belang dan bij vergelijkbare rollen binnen de Business IT.

Wat heeft een Data Scientist op zijn CV staan?

Het merendeel van de Data Scientists heeft een WO-opleiding afgerond, meestal in een IT-gerelateerde studie. Een Master in Computer Science of Artificial Intelligence is een hele geschikte vooropleiding om als Data Scientist aan de slag te gaan.

Data Science is een jong vakgebied (Data Scientists zijn dus niet zo grijs als onze avatar doet vermoeden). Ondanks het gewicht van de functie is Data Scientist heel vaak de eerste baan die afgestudeerden van met name de eerdergenoemde vooropleidingen.