
4 soorten AI agents: welke past bij jouw bedrijf?
- JumpScale
- Ai
- 27 maart 2026
AI agents zijn overal. Maar ‘agent’ is een containerbegrip geworden. Wij onderscheiden op dit moment vier soorten die fundamenteel anders werken. Dit artikel legt het verschil uit, met cases van Stripe, Shopify en Amazon, en wat we bij JumpScale zelf leerden.
Inhoudsopgave
Iedereen heeft het over AI agents. Niemand legt uit welke
“We gebruiken AI agents.” Dat hoor je overal. Op conferenties, in podcasts, in LinkedIn-posts van consultants die vorige maand nog over blockchain schreven. Maar vraag door en het wordt vaag. Wat voor agent? Wat doet die precies? Waar zit een mens in het proces?
Het probleem: “agent” is een containerbegrip geworden. Net als “cloud” tien jaar geleden. Alles is een agent. Een chatbot? Agent. Een script dat code schrijft? Agent. Een volledig autonoom systeem dat software oplevert? Ook een agent.
De cijfers zijn indrukwekkend. Gartner voorspelt dat 40% van alle enterprise-applicaties eind 2026 AI agents bevat. Dat was minder dan 5% in 2025. In Nederland is het AI-gebruik door bedrijven in drie jaar bijna verdubbeld: van 34% naar 67%. Maar Gartner waarschuwt ook: meer dan 40% van alle agentic AI-projecten wordt voor eind 2027 geannuleerd. Vaak omdat bedrijven het verkeerde type kiezen.
Voor jou als directeur is dat onbruikbaar zonder context. Je wilt weten wat je morgen kunt inzetten, wat dat kost, en wat de risico’s zijn. Daarvoor moet je het verschil kennen. Want de ene agent vervangt een stagiair, de andere een heel development team. Dat zijn fundamenteel andere beslissingen.
Laten we het uit elkaar trekken.
Vier soorten AI agents die er in de praktijk toe doen
Wij onderscheiden op dit moment vier types. Elk type heeft een ander niveau van autonomie, een andere rol voor mensen, en andere risico’s.
| Type | Wat het doet | Menselijke rol | Autonomie |
|---|---|---|---|
| Harness | Werkt naast je als digitale assistent | Je stuurt, reviewt, corrigeert | Laag tot gemiddeld |
| Dark factory | Krijgt een spec, levert een resultaat | Check aan het einde | Hoog |
| Auto research | Optimaliseert een metric via experimenten | Stelt de vraag, beoordeelt het antwoord | Gemiddeld tot hoog |
| Orchestration | Coordineert meerdere agents in een keten | Ontwerpt het systeem, monitort | Zeer hoog |
Dit is geen definitieve indeling. Het veld beweegt snel en de grenzen zijn vloeiend. Een harness die je maandenlang fine-tunet wordt bijna een dark factory. Orchestration kan auto research bevatten. Maar voor de keuzes die je nu als MKB moet maken, zijn dit de vier die ertoe doen.
De meeste bedrijven beginnen bij de harness. Dat is logisch. Maar de echte productiviteitswinst zit in de stap naar dark factory. En de echte risico’s ook. Laten we ze stuk voor stuk doorlopen.
De harness: je digitale assistent die beter wordt
Dit is het breedste type en de plek waar de meeste organisaties nu zitten. Een harness-agent werkt naast je. Jij geeft instructies, de agent voert uit, jij reviewt het resultaat. Denk aan een hele snelle collega die nooit moe wordt maar wel sturing nodig heeft.
Bekende voorbeelden: voor coding zijn dat tools als Claude Code, Cursor, OpenAI Codex en GitHub Copilot. Maar een harness hoeft niet over code te gaan. Microsoft Copilot in je Office-omgeving is ook een harness. Anthropic’s Cowork net zo. Of, zoals wij doen, een Claude Code agent die je uitrust met procedures en referentiemateriaal voor je hele infrastructuurbeheer. Dit is in wezen de stap van vibe coding naar agentic coding: niet zelf typen, maar een agent aansturen.
Hoe ver dit al gaat in de praktijk
Andrej Karpathy, mede-oprichter van OpenAI, draait sinds december 2025 tien tot twintig agents parallel. Zestien uur per dag. Hij heeft sindsdien geen regel code meer handmatig geschreven. Zijn beschrijving: “a state of psychosis.” Niet omdat het slecht werkt, maar omdat het tempo zo hoog ligt dat je brein moet wennen aan een compleet andere manier van werken.
Peter Steinberger ging viraal met OpenClaw: vier tot tien agents tegelijk, elk met een taak van twintig minuten. Hij zat er niet meer in als programmeur. Hij zat erin als projectmanager die taken verdeelt en resultaten checkt.
Cursor, het bedrijf achter de populairste AI-code-editor, heeft dit geformaliseerd met Background Agents. Een planner/executor model: jij beschrijft wat je wilt, de agent plant de aanpak en voert uit. Ze hebben er naar verluidt browsers en compilers mee gebouwd. Het bedrijf zou meer dan 500 miljoen dollar jaaromzet draaien. Meer dan de helft van de Fortune 500 gebruikt het.
Individueel vs. project-level
Er is een belangrijk verschil. Een individuele harness helpt jou persoonlijk sneller werken. Maar bij een team van acht tot twintig mensen heb je een project-level harness nodig. Die kent de codebase, de conventies, de architectuur. Die zorgt dat tien mensen met agents niet tien verschillende richtingen op bouwen.
Dat verschil wordt vaak onderschat.
Individuele productiviteit maal tien is niet hetzelfde als teamproductiviteit maal tien. Zonder project-level sturing krijg je chaos die sneller beweegt.
Dit zegt ook iets over de complexiteit van agents in een organisatie. Het is niet genoeg om iedereen een agent te geven. Je moet nadenken over hoe die agents samenwerken, welke kaders ze krijgen, en wie de regie houdt. Dat is een organisatievraagstuk, geen technisch probleem.
De dark factory: spec erin, resultaat eruit
Hier wordt het serieus. Een dark factory agent krijgt een specificatie, itereert zelfstandig, en levert een resultaat op. Geen mens in de loop tijdens het werk. Pas aan het einde een menselijke check.
De naam komt uit de maakindustrie: fabrieken die zo geautomatiseerd zijn dat het licht uit kan. Geen mens op de werkvloer.
Stripe draait dit op schaal. Duizend pull requests per week door AI agents. Ze hebben een fork gebouwd van Goose, een open-source agent framework. Het model is fire-and-forget: specificatie erin, code eruit, review aan het einde.
Nog indrukwekkender: StrongDM. Drie mensen. 32.000 regels productiecode. Zonder een regel handmatig te schrijven. Het hele product is gebouwd door agents die specs kregen en code opleverden. De mensen schreven specs, reviewden output, en stuurden bij.
Maar het kan ook misgaan. Amazon had op 6 maart 2025 een grote storing van zes uur. Checkout, login, productprijzen: niets werkte. In december 2025 volgde het Kiro-incident: dertien uur downtime in de China-regio. Beide incidenten waren gerelateerd aan AI-gegenereerde code-wijzigingen. De exacte oorzaken zijn niet volledig openbaar, maar het patroon is duidelijk: snelheid zonder voldoende review leidt tot problemen. Amazon heeft daarna noodmaatregelen ingevoerd: junior engineers moeten nu goedkeuring van een senior krijgen voor AI-assisted code changes.
Dit is het hybride model dat in de praktijk werkt: dark factory in het midden, menselijke check aan het einde. De agent doet het zware werk. Een mens valideert voordat het naar productie gaat. Geen van de succesvolle cases hierboven draait volledig zonder menselijke review.
Boston Consulting Group schat de productiviteitswinst op drie tot vijf keer bij teams die op dark factory niveau werken. Dat zijn hun eigen cijfers, niet onafhankelijk geverifieerd. Maar zelfs als je conservatief rekent met factor twee, praat je over een fundamentele verschuiving. Dat is het verschil tussen vijf developers en een team van drie met agents.
De keerzijde: als je review-stap niet deugt, vermenigvuldig je ook fouten met diezelfde factor. Wie zonder kwaliteitscontrole code laat genereren loopt tegen dezelfde risico’s als bij vibe coding.
Auto research: AI agents die een metric optimaliseren
Niet alle problemen zijn software-problemen. Soms wil je gewoon een getal verbeteren. Conversieratio omhoog. Laadtijd omlaag. Kosten per lead verlagen. Dat is een ander type werk dan code schrijven. En daar zijn andere agents voor.
Het idee komt uit klassiek machine learning: laat een systeem honderden varianten proberen, meet het resultaat, en kies de winnaar. Alleen nu kan de agent zelf de varianten bedenken, uitvoeren en evalueren.
Shopify’s Liquid engine. Tobi Lutke liet een AI agent los op Shopify’s Liquid template engine. Het resultaat na circa 120 experimenten en 93 commits: 53% sneller, 61% minder geheugenallocaties. Dat raakt 5,6 miljoen webshops. Lutke’s eigen kanttekening: “probably somewhat overfit.” Eerlijk. Maar de richting is duidelijk.
Karpathy’s autoresearch. Andrej Karpathy released op 7 maart 2026 zijn autoresearch-framework. Binnen twee dagen: 21.000 GitHub stars en 700 experimenten. Twintig daarvan leverden meetbare verbeteringen op. Zijn visie: “Je emuleert niet een PhD-student. Je emuleert een hele research community.” Elke run is een experiment. De agent leest eerdere resultaten, bedenkt een hypothese, test die, en logt de uitkomst.
De toepassingen zijn breder dan je denkt. Bedrijven als Mutiny en Intellimize gebruiken dezelfde aanpak voor conversie-optimalisatie. A/B-testen op steroiden. Code performance tuning. Query-optimalisatie voor databases.
Het cruciale onderscheid: is je probleem software-shaped of metric-shaped? Moet je een nieuw systeem bouwen? Of heb je een bestaand systeem met een getal dat beter kan? In het tweede geval is auto research je vriend.
Orchestration: meerdere AI agents in een keten
Tot nu toe hadden we het over enkele agents. Maar sommige taken zijn te complex voor een agent. Dan laat je meerdere gespecialiseerde agents samenwerken. Agent A haalt data op, geeft die door aan Agent B die het analyseert, en Agent C schrijft het rapport.
LangGraph is de zwaargewicht hier. Meer dan 100.000 GitHub stars, tientallen miljoenen downloads per maand, zo’n 400 bedrijven in productie. Cisco, Uber, LinkedIn, BlackRock. Interessant detail: het gemiddelde aantal stappen per agent-trace steeg van 2,8 in 2023 naar 7,7 in 2024. Agents worden complexer. Ketens worden langer.
CrewAI maakt multi-agent systemen met rollen. Denk aan een “researcher”, een “writer” en een “reviewer” die samenwerken. Een fintech-bedrijf zette in vier uur drie agents op voor hun klantcommunicatie.
n8n is de meest toegankelijke optie. Meer dan 400 integraties, een visuele editor, en AI Agent nodes die je kunt koppelen. Multi-agent workflows bouw je via de Workflow Tool node. Geen code nodig. Voor teams die snel willen starten zonder een developer in te huren is dit de meest capabele open-source optie.
Trigger.dev pakt het anders aan. Code-first, TypeScript-based. Een execution layer voor developers die hun agents in code willen schrijven maar niet hun eigen infrastructuur willen beheren.
De eerlijke vraag: wanneer loont orchestration? Elke businesscase loont uiteindelijk, maar de initiële investering bepaalt wanneer. Bij een simpel proces met weinig stappen is een enkele harness vaak genoeg. Orchestration wordt interessant zodra je meerdere stappen hebt die steeds terugkomen: klantverzoek binnenkrijgen, classificeren, routeren, beantwoorden. Hoe vaker dat proces draait, hoe sneller je de setup-tijd terugverdient.
Wat we zelf leerden over AI agents (en wat niemand je vertelt)
Dit is waar het concreet wordt. Geen theorie, maar wat we bij JumpScale dagelijks tegenkomen.
Een harness bouwen kost serieuze tijd. We hebben een harness en skillset gebouwd om onze hele infrastructuur te managen. Meerdere servers, configuratie, monitoring, het hele plaatje. Daar zijn we ruim een maand mee bezig geweest. Elke dag een klein half uur fine-tuning, naast het werk dat de agent uitvoert. Een onderdeel van ons traject om AI-native te worden.
Het resultaat: een agent die team-breed gebruikt kan worden. Volledige expertise, procedures en referentiemateriaal beschikbaar in de harness. Het hele infrastructuurbeheer van onze meerdere servers is een fluitje van een cent geworden. Maar die eerste maand investeren? Dat vertelt niemand je.
Harnesses zijn breder dan development. We gebruiken ze ook voor dagelijks digitaal werk. E-mailbeheer, administratie, research. Niet alleen voor code. De meeste content over AI agents gaat over software bouwen. In de praktijk zit de grootste winst vaak in het saaie werk dat elke dag terugkomt.
Auto research: we experimenteren nog. We testen auto research op processen als A/B-testing en query-optimalisatie. De resultaten zijn wisselend. Soms verrassend goed, soms een doodlopende weg. We zijn er eerlijk over: dit is nog niet af.
Orchestration: meerdere tools naast elkaar. Voor orchestration gebruiken we n8n en Trigger.dev. Voor het zwaardere werk, denk aan complexe multi-agent ketens met state management, focussen we op LangChain en LangGraph. n8n werkt goed voor workflows die we snel willen opzetten. Trigger.dev voor taken waar we meer controle nodig hebben. LangGraph voor de architecturen waar meerdere agents echt autonoom moeten samenwerken.
De kernles die niemand je vertelt: er gaat serieuze tijd en inspanning overheen om een agent goed te configureren. Het is geen plug-and-play. Door het dagelijks gebruik kom je edge cases tegen, waaronder security-risico’s van AI-tools die je vooraf niet ziet. Die edge cases zijn input voor doorontwikkeling en optimalisatie. Het wordt elke week een beetje beter. Maar “even snel een agent opzetten” bestaat niet.
Wat ook helpt: begin klein. Onze eerste harness deed drie dingen. Nu doet hij er dertig. Die groei kwam organisch, uit dagelijks gebruik. Niet uit een groot plan vooraf.
Keuzehulp: welke AI agent past bij jouw bedrijf?
Vijf vragen. Meer heb je niet nodig.
Heb je een slimme co-worker nodig die met je meedenkt? Start met een harness. Geef een AI agent context over je bedrijf, je processen, je voorkeuren. Dit is waar 90% van de MKB-bedrijven moet beginnen.
Wil je een specifiek getal verbeteren? Auto research. Conversieratio, laadtijd, kosten per lead. Werkt het beste als je al data hebt en een duidelijke metric.
Wil je autonoom software laten bouwen? Dark factory. Alleen relevant als je een development-team hebt en repetitieve bouw-taken wilt automatiseren. Niet waar je begint.
Heb je meerdere stappen die op elkaar volgen? Orchestration. Klantverzoek binnenkrijgen, classificeren, routeren, beantwoorden. Wordt interessant zodra dat proces vaak genoeg draait.
Twijfel je? Begin met een harness. Serieus. Het is de laagste drempel, de snelste resultaten, en je leert hoe AI agents werken voordat je investeert in complexere setups.
Budget: reken op 3.000 tot 8.000 euro in het eerste jaar voor een eenvoudige agent-setup. Dat is licenties, configuratietijd en fine-tuning. De grootste kostenpost is niet de software. Het is de tijd om de agent te trainen op jouw specifieke situatie.
De volgorde voor MKB: harness eerst. Dan orchestration via n8n, Trigger.dev of een vergelijkbare tool voor je repetitieve workflows. Dark factory en auto research zijn voor later, als je al ervaring hebt met agents en weet wat je wilt automatiseren.
Hulp nodig?
Wil je weten welk type AI agent bij jouw bedrijf past? We denken graag mee. In 30 minuten bespreken we welk type agent bij jouw situatie past. Geen verkooppraatje, gewoon een eerlijk gesprek.
Bronnen: Fortune — Karpathy over “state of psychosis” en agents (2026), Fortune — Steinberger/OpenClaw profiel (2026), Simon Willison — StrongDM dark factory (2026), Simon Willison — Shopify Liquid 53% sneller (2026), VentureBeat — Karpathy autoresearch (2026), Medium — Stripe 1.000 PRs/week (2026), Tom’s Hardware — Amazon AI-code incidents (2025), BCG Platinion — The Dark Software Factory (2026), LangChain — State of AI Agents (2024), n8n — AI Agent documentatie, Gartner — AI agents in enterprise apps (2025), CBS — AI-gebruik door bedrijven (2025)


