DTL S2A15 - Scikit-LEGO

Share:

Listens: 0

De Dataloog

Technology


Wat als je grootgebruiker bent van de Python package scikit-learn, maar je merkt dat jij en je collega's regelmatig handmatig scriptjes maken om iets op te lossen wat niet out-of-the-box in scikit-learn voorkomt? Dan bouw je toch je eigen Python package! In aflevering 15 van seizoen 2 spreken Jurjen en Stephanie met Matthijs Brouns en Vincent Warmerdam, makers van de python package scikit-lego. Scikit-lego is een open source package bestaande uit 'legoblokjes' die data scientists en machine learning engineers kunnen gebruiken in hun projecten. Dit zijn bijvoorbeeld blokjes voor het transformeren of modelleren van data, maar ook om meer 'fairness' toe te voegen in een model. Scikit-lego is ongeveer een jaar oud en heeft op dit moment 28 contributors van over de hele wereld, 300 commits en 2.500 downloads per maand. En dat is zo gaaf aan het bouwen en onderhouden van een open source project; dat mensen die je niet kent je package gaan gebruiken, maar ook hieraan kunnen bijdragen en de package beter kunnen maken. Een leuke toevoeging: als je (net als in Python) from scikit-lego import this uitvoert, krijg je een gedichtje waarin onder andere wordt aangegeven dat scikit-lego geen formele banden heeft met zowel scikit-learn als Lego. :) Matthijs Brouns is data science trainer bij Xccelerated en co-chair van PyData Amsterdam. Twitter: @fishnets88 Vincent Warmerdam is research advocate bij Rasa en co-founder van PyData Amsterdam. Twitter: @MatthijsBrs