Door de jaren heen hebben wij gewerkt met veel verschillende typen organisaties. De overeenkomst? De wens om beter en slimmer hun werk te kunnen doen. Met data, machine learning en AI.
In deze tijd hebben we ook AI-producten of beter gezegd AI-bouwstenen ontwikkeld, die we kunnen personaliseren naar jouw wensen.
Profiteer jij hier ook van?
Lees verder!keyboard_arrow_rightTerug naar alle projectenkeyboard_arrow_rightHet fijne van goed-geschreven code (en goede IP-afspraken) is dat je deze kan hergebruiken. En het mooie van machinelearning-modellen (en zo ook taalmodellen) is dat je deze kunt bijtrainen in verschillende specifieke vakgebieden en in verschillende talen.
Dit kunnen we doen met kleinere en grotere stukken code en machinelearning- en taalmodellen. De grootste hiervan zijn onze 'AI-producten' Selectical en Pseuduck die we kunnen personaliseren om jou te kunnen ondersteunen in je werk.
Scroll direct naar productenkeyboard_arrow_rightNLP, ofwel Natural Language Processing, betreft het gebruiken taalkunde, data science, artificial intelligence en machine learning om een computer natuurlijke taal te kunnen laten 'begrijpen'. (Denk aan ChatGPT.) Hiermee kan je bijvoorbeeld gemakkelijker door teksten heen zoeken, deze samenvatten, deze anonimiseren, deze beoordelen, vragen stellen, etc.
De meeste taalmodellen zijn gebaseerd op het Engels, terwijl we in Nederland nog veel organisaties hebben die volledig in het Nederlands opereren. Daartoe werken we ook aan Nederlandse NLP.
Eigenlijk is Pseuduck een pseudonimisatie-tool, maar als je kunt pseudonimiseren, kan je ook anonimiseren. Het komt namelijk vooral neer op het herkennen van verschillende entiteiten zoals namen, steden, telefoonnummers, adressen, geslacht, banen, etc. Dit doen we met Named Entity Recognition (NER).
Hiermee kan je herkennen of er überhaupt persoonsgegevens staan in jouw teksten of documenten en deze naar wens maskeren, hernoemen of verwijderen. Ideaal voor als je data wilt delen met klanten, collega's, partners, voor onderzoek, etc.
Meer over Pseuduckkeyboard_arrow_rightHet vinden en/of selecteren van relevante documenten, teksten of nieuwe publicaties voor jouw onderzoek (of dit nu due dilligence of systematisch literatuuronderzoek is), kan best wel een werk zijn.
Als je dit vaak moet doen, heb je vast wel eens gedacht "had ik hier maar een personal assistent voor".
Die is er nu! Het heet Selectical. :)
Meer over Selecticalkeyboard_arrow_rightData of bestanden delen, kan niet altijd zomaar. Vaak bevat deze namelijk persoonsgegevens of overige privacyschendende informatie. Als je aan de AVG wilt voldoen, moet je dus eerst wat werk steken in het anonimiseren of pseudonimiseren van de data, voordat je er iets mee mag doen.
Tot nu wordt het meeste anonimiseringswerk met de hand gedaan. Dit is een hoop werk, kost veel tijd en is – net als elke langdurige rotklus – gevoelig voor fouten. Zeker als het gaat om vrije tekst!
Pseuduck is een door ons ontwikkelde pseudonimiseringstool die het gemakkelijker maakt om jouw vrije teksten – van kleine tekstvelden tot grote (collecties van) documenten – AVG-proof te maken.
Het mooie van Pseuduck is dat we het kunnen bijtrainen in verschillende vakgebieden én in het Nederlands, om jouw teksten, in jouw vakjargon en naar jouw behoeften te kunnen pseudonimiseren of anonimiseren.
Onderzoekers die (systematisch) literatuuronderzoek doen, moeten vaak véle duizenden artikelen screenen om die artikelen te vinden die relevant zijn voor hun onderzoek. Daarbij moeten ze grondig zijn, omdat er vaak niets gemist mag worden. Echter zijn van die duizenden papers vaak slechts een paar honderd relevant. Deze selectie handmatig doen kost ontzettend veel nuttige tijd en is simpelweg niet leuk.
Normaal gesproken train je een AI-model op basis van gelabelde data. Op basis van voorbeelden. Maar dat kan in dit geval niet! De uitdaging is namelijk dat gezien elke literatuurstudie anders is, er geen voorbeelden zijn. Dat labelen van die voorbeelden is eigenlijk precies je werk. Maar dat betekent niet dat je dan geen AI kunt trainen!
Hiervoor hebben we Active Learning gebruikt: een type AI dat leert van menselijke input en zich continu verbetert tijdens het werken. Zo kan de onderzoeker op dezelfde manier aan de slag met hun werk, terwijl de AI meeleert. Op het moment dat de AI zeker genoeg is dat het de juiste patronen heeft opgepikt, neemt deze het labelen van de artikelen over en hoeft de onderzoeker dit alleen nog te valideren of corrigeren. Scheelt een hoop werk!
Lees meer over Selecticalkeyboard_arrow_rightVraag direct een demo aankeyboard_arrow_rightVoordat we met elkaar aan de slag gaan aan oplossingen, maken we duidelijke afspraken over de doeleinden, wat er wordt gebruikt en wiens eigendom de resulterende producten zijn. Hierin zijn meerdere vormen mogelijk. We werken en denken graag met je mee!