Organisatie onderdeel
De KVK is op zoek naar interim een AI Data Scientist. Je gaat werken bij de afdeling InnovatieLab. Wij werken helemaal aan het begin van de productcyclus. Wij zorgen voor meer zicht op duidelijke business cases. Dat doen we door validatie van de aannames en we maken de gebruikerswensen helder. Door kortcyclisch oplossingen te toetsen bij klanten, binnen de eigen organisatie en op maakbaarheid, krijgen we inzicht in de haalbaarheid van nieuwe processen, producten en diensten. Het doel is om interesse te creëren in de organisatie die de ideeën, met onze hulp, om kan zetten naar nieuwe producten en diensten. Met een ondernemende houding bereik je binnen de KVK het meest. Mensen die kansen signaleren en deze verzilveren, passen dan ook het beste bij ons. Ben jij zo iemand en herken jij jezelf direct als onze nieuwe Data Scientist? Reageer dan nu!
Wat ga je doen?
KVK InnovatieLab toetst deze aannames door werkende prototypes/proof of concepts te bouwen om daarmee de maakbaarheid, de gewenstheid, de mogelijkheden voor strategische inpassing aan te tonen (of te verwerpen). Je belangrijkste activiteit is het bouwen van de proto-applicaties in korte sprints. Je codeert en managet de pipeline naar onze POC-omgeving. Je gebruikt open source libraries en bestaande modellen waar mogelijk en maakt die toepasbaar voor KVK. Je documenteert de verantwoording, herleidbaarheid en validatie van de toegepaste modellen en begeleidt de overdracht. Je geeft advies over de te onderzoeken gebieden, de te gebruiken technieken, en de uitvoering van de tests.
Verantwoordelijkheden:
- Vertaalslag maken van kans naar concrete aanpak en opzet van experiment;
- Realiseren van Proof of concepts/prototype oplossingen op basis van AI services;
- Functionele story's schrijven;
- Experimenteren en valideren van proto-oplossingen;
- Gebruikersonderzoek (mede-)faciliteren;
Kandidaatomschrijving
Resultaatgericht: Werkt doelgericht en vasthoudend naar resultaten toe en weet het resultaat op efficiënte en effectieve wijze te realiseren.
Samenwerken: Handelt vanuit het groepsbelang en levert samen met anderen een bijdrage aan het gemeenschappelijke resultaat en aan de relaties en sfeer in de groep.
Kwaliteitsgericht: Hanteert hoge kwaliteitsnormen bij de uitvoering van het werk, bewaakt en verbetert deze waar mogelijk.
Communiceren: Verwoordt gedachten helder en vlot, brengt mondeling en schriftelijk een boodschap begrijpelijk over aan anderen en weet hierbij hun aandacht vast te houden.
Creativiteit: Bekijkt situaties vanuit verschillende invalshoeken. Kan vaststaande interpretatiekaders loslaten, komt tot alternatieve, oorspronkelijke en vernieuwende ideeën.
Eisen
- Kandidaat heeft WO werk- en denkniveau;
- Kandidaat heeft een opleiding op het gebied van Datascience, Machine learning, Datamodellering, Artificial Intelligence of vergelijkbaar;
- Kandidaat heeft aantoonbare en actuele kennis van datamodellering: verantwoording, herleidbaarheid en validatie van toe te passen modellen;
- Kandidaat heeft actuele (in de afgelopen 5 jaar) en minimaal 3 jaar aantoonbare ervaring met de volgende technieken: Natural language processing; Large Language Models; Machine Learning; Text mining en cluster-analyses, validatie, allen fundamentele kennis; Feature engineering; Model selectie & training; Model Evaluatie & Optimalisatie;
- Kandidaat heeft actuele (in de afgelopen 5 jaar) en minimaal 3 jaar aantoonbare ervaring met Programmeertaal Python;
- Kandidaat heeft actuele (in de afgelopen 5 jaar) en aantoonbare ervaring met het (zelfstandig) werken met CI/CD pipelines, bij voorkeur GitLab CI en containerplatforms, bij voorkeur Docker en Kubernetes;
- Kandidaat heeft actuele (in de afgelopen 5 jaar) en aantoonbare ervaring met RAG en met open source LLM's;
Wensen
- Kandidaat heeft een afgeronde academische opleiding (Weging: 5%);
- Kandidaat heeft ... jaar aantoonbare ervaring met Natural language processing; Computer vision; OCR - allen fundamentele kennis. (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 7%);
- Kandidaat heeft ... jaar aantoonbare ervaring met deze data verrijking: knowledge graphs, ontologien, taxonomieën, data modelling, metadatering, webscaping, data visualisatie (Matplotlib) (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 7%);
- Kandidaat heeft ... jaar aantoonbare ervaring met information retrieval: search, semantic search en linked data (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 6%);
- Kandidaat heeft ... jaar aantoonbare ervaring met het werken in de (semi-)publieke sector, liefst met oplossingen bij basisregisters (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 6%);
- Kandidaat heeft ... jaar aantoonbare ervaring met het in productie brengen van AI oplossingen (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 6%);
- Kandidaat heeft ... jaar aantoonbare ervaring met Relevante Python libraries (bijv. scikit-learn, pandas, spacy, pytorch, openai) en Testframeworks (bijv. pytest), TensorFlow, Keras, NumPy, Flask, Spark (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 7%);
- Kandidaat heeft ... jaar aantoonbare ervaring met PostgreSQL, MySQL, MongoDB (0 tot 3 jaar: 2%, 3 tot 5 jaar: 4%, 5 jaar of meer: 6%);