Per jaar worden er door DAS 7 miljoen documenten gegenereerd! Kennis uit deze (ongestructureerde) data wordt nog beperkt benut, dus daar valt nog veel te halen. Beklim deze berg data en gebruik je kennis van NLP-algoritmes om deze om te zetten naar waardevolle gestructureerde data. Bouw verder aan de infrastructuur en de NLP-pipeline in Elastic Search.
Wil je pionieren en heb je wel zin in een grote uitdaging? Neem contact op!
Dit ga je doen als NLP Data Scientist
Bij DAS worden jaarlijks meer dan 100.000 dossiers behandeld. Deze grote aantallen van dossiers zorgt voor een enorme hoeveelheid data, waarvan de data in gestructureerde vorm slechts het tipje van de ijsberg is. Bij DAS gaan we na een aantal geslaagde Proof of Concepts nu echt beginnen met het genereren van voorspellingen op basis van deze ongestructureerde data. Hiervoor hebben we jouw NLP kennis en ervaring nodig. Dit zorgt ervoor dat je in deze functie een grote verantwoordelijkheid krijgt bij het Data Science Team. We staan aan het begin van deze boeiende reis, wat ervoor zorgt dat een stukje flexibiliteit en ondernemerschap erg gewenst is.
Waar kom je terecht?
Zoals al vermeld, kom je terecht in het Data Science Team van DAS, wat een gezonde groeiambitie heeft. De standplaats van je functie is in Amsterdam.
Bij DAS werken we hybride. Dit betekent dat je maximaal 50% van je werkweek op ons kantoor in Amsterdam Zuid-Oost bent. De rest van de week werk je thuis of vanuit een andere locatie. Voor elke dag dat je op een andere locatie dan ons kantoor werkt, ontvang je een thuiswerkvergoeding van €2,- per dag
Onze organisatie wordt gekenmerkt door het mensgerichte karakter en collegialiteit. Onze cultuur is uit te drukken in de volgende waarden: menselijk, slim, open, betrokken en optimistisch.
Academisch werk- en denkniveau (studie Econometrie, Wiskunde, Statistiek, Business Analytics, Computer Science, Data Science, Kunstmatige Intelligentie)
Minimaal 2 jaar werkervaring in een Data Science / Engineer functie waarbij NLP werd toegepast
Diepgaande kennis en ervaring met het analyseren en modelleren van ongestructureerde data. Kennis op het gebied van Natural Language Processing, Information Extraction en Machine Learning
Kennis van en ervaring met scripting en programmeertaal Python en eventueel R
Kennis van en ervaring met verschillende vormen van dataopslag (vooral noSQL, zoals Elastic Search en/of MongoDB)
Goede beheersing van de Nederlandse taal in woord en geschrift
Nice to have
Ervaring met juridische ongestructureerde data is een pré
Ervaring met het opzetten en onderhouden van Elastic Search is een pré
Ervaring met werken in Agile projectomgeving is een pré