Overslaan naar hoofdinhoud
Pulse
developer

DevOps cruciaal voor een geolied data science team

Microsoft Nederland

Microsoft Nederland

Microsoft Nederland

Leestijd, 5 min.

Kunstmatige intelligentie (of AI) is de sleutel tot efficiënter management op basis van data. Zelflerende systemen zien sneller interessante dwarsverbanden en helpen je beter bij het nemen van de juiste beslissingen. Elke organisatie wil daarom profiteren van slimme algoritmes. Maar voordat ze dat kunnen doen, lopen ze vaak tegen dezelfde uitdagingen aan binnen dit nieuwe vakgebied. Wat zijn de hordes en hoe zorg je voor goede resultaten van je data science team?

Deze blog is tot stand gekomen door een interview met Dennis Eikelenboom (Data Scientist), Gabrielle Davelaar (Data Platform Solution Architect), Jaap Mollema (Digital Advisor)
We zien dat heel veel organisaties op de AI-trein springen en data science teams oprichten. Na een enthousiast begin, vallen de resultaten in de praktijk vaak tegen. De fase na een proof of concept wordt niet gehaald, of eenmaal in productie, blijken niet alle componenten een schaalbaar product te vormen.

De juiste balans tussen processen technologie en mensen
Een gebalanceerd data science team zorgt dat je niet tegen deze problemen aanloopt. Een goed team heeft de juiste balans tussen goed ingerichte processen, de juiste technologie en vooral de juiste mensen. Samen moeten zij de hele levenscyclus van het model weten te doorlopen: van AI-experiment tot productie van de applicatie en het continu onderhouden en verbeteren van het model. Hierdoor verslechtert de modelkwaliteit niet en blijft zoveel mogelijk transparantie geboden omdat duidelijk is via welke stappen een model tot een bepaald inzicht is gekomen.

Modellen moeten herleidbaar zijn
Het development proces moet ten eerste herleidbaar zijn ingericht. Het team maakt modellen die invloed hebben op bijvoorbeeld behandelplannen in ziekenhuizen of op de reserves van financiële instellingen. Voorspellen de modellen verkeerd, dan kan dat uiterst nare consequenties hebben en dan komt er natuurlijk een schuldvraag. Waarom kwam het model met dit resultaat? Technisch moeten er voldoende logs geïmplementeerd zijn zodat de uitkomsten herleidbaar zijn. Je moet achteraf kunnen aantonen wat er precies is gebeurd. Dit is dan ook een continu proces waarbij onoplettendheid ervoor kan zorgen dat vooroordelen in het model sluipen.

Met AI is iedereen verantwoordelijk voor innovatie
Met kunstmatige intelligentie is vaak het adagium: hoe meer data, des te beter de resultaten van de modellen. Alle data uit de organisatie kan bijdragen aan betere inzichten. Dat houdt ook in dat de hele organisatie verantwoordelijkheid draagt voor de innovatie. Zijn de data niet goed, dan heeft dat negatieve impact op de uitkomsten van het model. Silo’s zijn hierdoor niet meer denkbaar: iedereen doet mee. Anders krijg je scenario’s zoals bij BNP Paribas. Daar schoot de fraudedetectie tekort vanwege miscommunicatie tussen de bedrijfsonderdelen en werkte het systeem niet. Het data science team mag dus geen eiland binnen de organisatie zijn. Het moet meer zijn dan een solistische groep die alleen hypotheses valideert en daarna deze resultaten laat verstoffen in een slide deck. In de praktijk zien we dat de ontwikkeling vaak stokt.

Data science teams zijn vaak te homogeen
Het blijft vaak bij een experiment omdat de data science teams veelal uit leden met dezelfde skills bestaan. Kijk maar naar de vacatures voor data scientists: je ziet daar vooral analistenprofielen met achtergronden in wiskunde en statistiek. Data scientists uit de academische wereld stoppen meestal na het experiment omdat hun werk gedaan is. Ze hebben hun model immers al getoetst. Daarna is het toch tijd voor het volgende project, de volgende puzzel om op te lossen?! Eigenlijk is dit pas het begin.

Het vak data science is volop in ontwikkeling
Data science zit nu in de ontwikkeling waar software development jaren geleden in zat. Het vakgebied is nog relatief jong en best practices op veel gebieden worden nog altijd gevormd. Met meer en meer experimenten is standaardisatie van methodologieën en processen van belang om data science op schaal uit te kunnen voeren. Het team data science process van Microsoft biedt als methodologie structuur binnen de verschillende fases van het data science proces; van het ophalen van de data tot de uitrol van een model.

DevOps noodzakelijk in data science teams
We zien dat veel data teams leunen op traditionele software teams om modellen naar productiesoftware te kunnen brengen. Een data team moet zelf in staat zijn om van experiment naar productie te schalen om ondersteuning te kunnen blijven bieden op modellen in productie. Het toepassen van DevOps-principes binnen het data science veld is essentieel om een gecontroleerde en frequente uitrol van modellen mogelijk te maken.

Modellen blijvend trainen
Traditionele software development is echter anders dan AI Development, waardoor DevOps niet 1:1 toe te passen is in dit deelgebied. Data speelt een belangrijke rol in de kwaliteit van de software (het machine learning model), het moet daarom worden meegenomen in het testproces. Anders dan met traditionele softwarekwaliteit, zal de modelkwaliteit met de tijd verslechteren als er geen hertraining plaatsvindt. Continue monitoring van zowel model performance als datakwaliteit is daarom belangrijk. De Azure AI-diensten bieden een solide platform voor het schalen van experiment naar productie, continue verbetering, geautomatiseerde uitrol en monitoring van modellen.

Multidisciplinaire data science teams brengen succes
Een goed data science teams is multidisciplinair. Nu zien we dat de teams tekort schieten in de software development fase. Je hebt verschillende type vaardigheden nodig om modellen tot productie te brengen. Data science bestaat uit zoveel verschillende gebieden waardoor het bijna onmogelijk is om dat door collega’s met dezelfde achtergrond te laten doen.

Op naar betere AI-resultaten
Uiteindelijk wil je een team dat alles kan. Onder andere het presenteren van resultaten, datavoorbereiding, het modelleren, de pure analyse, advies en hands-on bepalen dat de data niet goed zijn. Deze rollen moeten elkaar kunnen begrijpen en elkaars werk een beetje kunnen uitvoeren. Wil jij ook een geolied data science team? Neem dan contact met ons op. Wij kunnen je zowel procesmatig en technologisch begeleiden zodat jij meer uit je AI-investering haalt.

Gratis AI-rapport: kunstmatige intelligentie in Nederland. Hoe 277 grote Europese bedrijven profiteren van AI

Ontdek hoe jouw West-Europese en Nederlandse collega's AI gebruiken om hun organisatie digitaal te transformeren

Probeer Microsoft Azure gratis

Werk je volgende geweldige idee uit met Azure

Ontdek meer gerelateerde artikelen per branche:

Educatie

Financiële dienstverlening

Government

Overheid

Productie

Retail

Zorg

Ontdek meer gerelateerde artikelen per dossier:

Digitale transformatie

  • ‘Het geheim van succesvolle start-ups’

    ‘Het geheim van succesvolle start-ups’

    Niels Lohuis (Product Marketing Manager Microsoft Nederland) gaat in gesprek met verschillende ondernemers over ‘technologie als groeiversneller voor ondernemers’. In deel VII praat hij met Quintin Schevernels. Een groter pand, nieuwe producten of diensten, (meer) mensen in dienst nemen, innoveren, nieuwe verkooppunten openen, misschien wel wereldwijd… Groeien houdt voor iedere ondernemer weer iets anders in. […]

Klantverhalen

Partners

  • Optimale samenwerking mogelijk met BIM Cloud Workspace

    Optimale samenwerking mogelijk met BIM Cloud Workspace

    Veel organisaties worstelen met de vraag hoe ze op een slimme, efficiënte manier onderling en met medewerkers van andere organisaties kunnen samenwerken. Zo wordt er gezocht naar manieren om eenvoudig gegevens te kunnen delen, zoals documenten, foto’s, tekeningen en modellen. Vanuit deze gedachte hebben steeds meer partijen interesse in de BIM Cloud Workspace. TBI is […]

Pers

Pers / Nieuws

  • een man met een hololens

    Verandering in een stroomversnelling

    De eerste fase van de COVID-19-uitbraak stond vooral in het teken van snelle oplossingen en crisismanagement om de dagelijkse gang van zaken in goede banen te leiden. Nu gaan we over naar een nieuwe fase, een hybride realiteit, waarin we zowel thuis als op locatie werken. Een tijd waarin verzorgingstehuizen weer voorzichtig opengaan en bedrijven […]

Security & Privacy

  • Bouwen aan cloudvertrouwen

    Bouwen aan cloudvertrouwen

    In een tijd waarin technologische ontwikkelingen elkaar in rap tempo opvolgen, is vertrouwen misschien wel het belangrijkste onderwerp. Zoals Brad Smith, President & Chief Legal Officer van Microsoft, het recent zei: “Technology needs to advance, but timeless values need to endure. Privacy and the proper rule of law stand among these timeless values.” Waar het […]

Tips

  • een vrouwen die thuis werkt achter een laptop

    Breng je personeelsbestand op afstand in topconditie

    Nederland werkt massaal thuis en dat blijven velen ook na COVID-19 waarschijnlijk doen. De snelle opkomst van AI, automation en data analytics verandert daarnaast de vraag naar type werk. Dit zijn maar een aantal ontwikkelingen waardoor je je HR-beleid over een andere boeg moet gooien. Wat zijn deze trends en hoe zorg je dat je […]

Webinars

  • Een vrouw achter haar laptop

    Webinarreeks: Digitaal transformeren met Microsoft Azure

    Ben je online aan het winkelen dan krijg je op basis van je aankoopgeschiedenis en je profiel aanbiedingen op maat. Heb je een vraag, dan geeft een chat bot antwoord. Alle bedrijven en overheden zijn op dit moment aan het digitaal transformeren naar dit gepersonaliseerde serviceniveau door data-analyse. Vergemakkelijk dit proces en stap over op […]