De AI-race gaat hard: Opus 4.6 en GPT-5.3-Codex.

Editie #1. Welkom bij de eerste editie van de AI Agent nieuwsbrief, bedankt voor het aanmelden.

Gisteravond kreeg ik een push melding: Opus 4.6 is uit. Enkele uren nadat het langverwachte model van Anthropic uitkwam, kwam rivaal OpenAI met GPT-5.3-Codex. De timing zegt genoeg. Dit is een race, en beide partijen willen winnen.

Claude Opus 4.6: de details

1 miljoen tokens context. Dat betekent dat je een compleet boek, een hele codebase, of maanden aan emails in een gesprek kunt laden. Voorheen moest je het in stukjes knippen. Of kostte het simpelweg meer tijd voor de subagents de codebase te begrijpen. Nu gaat dat een stuk sneller.

Agent teams (swarms). Meerdere AI-agents die samenwerken aan een taak. De een doet research, de ander schrijft de code, een derde reviewed de geschreven code. In business taal: jij (de CEO) die een idee heeft, die het bespreekt met je CTO (je Claude Code terminal), die vervolgens op basis van jouw feature requests letterlijk software developers, marketeers, specialists spawnt om te werken aan jouw idee. Dit verandert hoe je werkt.

Adaptive thinking. Het model bepaalt nu zelf hoeveel het moet nadenken. Bij een simpele vraag krijg je snel antwoord. Complex probleem? Dan gaat het model dieper graven, zonder dat je er specifiek om hoeft te vragen.

GPT-5.3-Codex: de details

OpenAI's antwoord op Opus 4.6.

Beste coding performance ooit. 57 procent op SWE-Bench Pro, 76 procent op TerminalBench 2.0, 64 procent op OSWorld. Voor de niet-nerds: dit zijn de standaard tests waarmee coding AI wordt gemeten. Deze scores zijn records.

25 procent sneller. En het gebruikt de helft van de tokens van de vorige versie voor dezelfde taken. Sneller en efficienter.

Live bijsturen. Je kunt het model corrigeren terwijl het werkt. Zie je dat het de verkeerde kant opgaat? Gewoon ingrijpen en bijsturen. Dat kon voorheen niet. Dit noemen ze mid-task steerability.

Computer use. Het model kan nu ook je computer bedienen. Klikken, typen, navigeren. Nog experimenteel, maar het werkt.

Het model dat zichzelf bouwde. GPT-5.3-Codex is het eerste model dat heeft meegeholpen zichzelf te trainen en deployen. OpenAI's team gebruikte vroege versies om bugs te fixen, training te monitoren, en tests te analyseren. AI die AI bouwt. Dat is waar we nu zijn.

Wat betekent dit voor ons?

Developer? De slimste devs die ik volg kiezen niet een model, ze switchen per taak. Opus 4.6 voor het plannen van architectuur en complexe problemen. GPT-5.3-Codex voor snel uitvoeren en debuggen. Niet of-of, maar en-en.

En die 1 miljoen tokens context van Opus 4.6? Voor coding is 200k vaak genoeg. Waar het wel presteert: als je een complete codebase in een keer wilt analyseren.

Werk je op kantoor? Hier wordt Opus 4.6 heel interessant. 90.2 procent score op juridisch redeneren. Context window van 1 miljoen tokens. Maanden aan emails doorzoeken. Complete jaarverslagen analyseren. Klantfeedback van een heel kwartaal samenvatten. Dingen waar je normaal dagen voor uittrekt, doe je nu in minuten.

Ben je ondernemer? Dit is waar agent teams uitblinken. Opus 4.6 kan meerdere sub-agents coordineren zonder de draad kwijt te raken. Multi-day workflows die context niet vergeten. Een research agent die tonnen documenten leest en alles onthoudt. Een assistent agent die je hele projectgeschiedenis kent. Een coordinator agent die je team van AI-agents aanstuurt. Een agent doet je marktonderzoek, een ander schrijft je content, een derde checkt alles. Zonder dat jij hoeft te coordineren. Dit werkt nu.

De vraag is niet of je het gaat gebruiken, maar wanneer je concurrenten het gaan doen.

Praktische tips om er meer uit te halen

Laat Claude nadenken. Bij complexe vragen loont het om te vragen: denk hier goed over na voordat je antwoordt.

Gebruik de 1m context size van Opus 4.6. Vraag je Agent of hij hele documenten voor je wilt analyseren op verbanden. Een jaarverslag te analyseren. Maanden aan klantfeedback samen te vatten.

Use subagents en splits grote taken op. Bij complexe projecten kun je Claude vragen om sub-taken parallel uit te voeren. Voeg simpelweg use subagents toe aan je prompt voor meer compute.

Run /insights in je Claude Code terminal. Vervolgens zal Claude je bericht geschiedenis met Claude analyseren en samenvatten en je suggesties doen van hoe je je workflow verder kunt verbeteren.

Claude Code GitHub commits nemen exponentieel toe

Momenteel wordt 4 procent van alle GitHub commits geschreven door Claude Code. Dat zijn er 134.000+ per dag. De verwachting is dat dit 20+ procent is tegen eind 2026. Niet gek, als zelfs de creator van Claude Code toegeeft geen enkele regel code meer zelf te schrijven.

Als je ooit een idee hebt gehad voor een tool maar dacht ik kan niet programmeren, die drempel is nu weg. Het kost je hooguit een avond om te ontdekken wat mogelijk is.

Gebruik je AI Agent als dagelijks werkpartner

De meeste mensen openen hun AI Agent, stellen een vraag en sluiten het weer af. Dat is alsof je een Ferrari huurt en er een keer in zit om te ervaren hoe het voelt.

De echte waarde zit in het optimaal gebruik maken van de AI Agent. OpenClaw is een open-source AI-agent die op je eigen computer of server draait en taken uitvoert via WhatsApp of Telegram. E-mails versturen, je agenda beheren, code schrijven, gewoon door een berichtje te sturen. Het project ging viraal met 145k+ GitHub-stars in een paar dagen. Simpel is het niet. De agent krijgt toegang tot al je accounts, dus je moet precies weten wat je doet qua beveiliging.

Persoonlijk gebruik ik OpenClaw al een maand, en het is echt een gamechanger. De reden waarom ik er zo veel uit haal is omdat ik het volledig heb gecustomized met unieke skills die ik heb gecreerd en software die ik heb geschreven waar hij gebruik van maakt om een nog betere assistent te zijn van mij.

OpenClaw verzorgt momenteel voor mij morning standups, project management, kritische reflectie als co-CEO, day-end standups en binnenkort ook administratie. Geen ziektedagen. Geen vakantie. Altijd beschikbaar.

Het voelt in het begin onwennig. Alsof je vals speelt. Na een week vraag je je af hoe je ooit zonder werkte.

Solopreneurs zijn niet langer een grap

Alle taken die herhaaldelijk plaatsvinden en die je kunt beschrijven, kunnen grotendeels worden geautomatiseerd. De functie assistent is overbodig aan het worden. Mijn vrienden kijken me raar aan wanneer ik dat zeg, maar het is echt zo.

De race gaat niet meer over wie de slimste chatbot bouwt. Het gaat over wie de beste werkpartner bouwt.

En die wedstrijd is al begonnen.

De AI-race gaat hard: Opus 4.6 en GPT-5.3-Codex.

Claude Opus 4.6: de details

GPT-5.3-Codex: de details

Wat betekent dit voor ons?

Praktische tips om er meer uit te halen

Claude Code GitHub commits nemen exponentieel toe

Gebruik je AI Agent als dagelijks werkpartner

Solopreneurs zijn niet langer een grap

Meer lezen

De Amerikaanse overheid heeft nu een kill switch op de beste AI ter wereld, en versnelt daarmee precies wat ze probeert tegen te houden.

Claude Opus 4.8 is uit, Anthropic haalt 65 miljard op tegen een waardering van 965 miljard, en zet IBM aan tot een security-fonds van 5 miljard.

Google's zoekbalk krijgt het grootste redesign in 25 jaar, AI Mode passeert een miljard gebruikers per maand, en Andrej Karpathy stapt over naar Anthropic.

Klaar om AI in te zetten?