Browser automation avec Claude : automatiser n'importe quel site en 2026
Claude peut désormais piloter un navigateur comme vous le feriez. Réserver, scraper, soumettre, télécharger : ce qu'on faisait avec Selenium en 200 lignes se fait en 1 prompt.
Vous avez déjà passé 4 heures à coder un script Selenium pour scraper un site qui change de structure tous les mois ? En 2026, vous pouvez le remplacer par 3 lignes de prompt envoyées à Claude. Et ça marche.
La browser automation pilotée par LLM est l'une des rares technologies qui ont autant de valeur pour un développeur que pour un dirigeant non-technique. Voici comment elle fonctionne, ce qu'elle permet vraiment, et comment l'intégrer dans votre business.
La rupture par rapport à Selenium et Puppeteer
Les outils traditionnels (Selenium, Puppeteer, Playwright) demandent que vous écriviez du code spécifique pour chaque site. Si le site change un nom de classe, votre script casse. Maintenance permanente.
La browser automation IA renverse le paradigme : vous décrivez ce que vous voulez, l'agent trouve comment. Il observe la page (DOM + screenshot), réfléchit, agit, vérifie, recommence si nécessaire.
Les frameworks dominants en mai 2026
| Outil | Type | Prix | Force | |-------|------|------|-------| | Browser Use | Open-source Python | Gratuit | 35 K stars GitHub, mature | | Stagehand (Browserbase) | TypeScript SDK | Free + cloud | Hybride code + IA | | Playwright Agent | Microsoft | Gratuit | Officiel, intégré Playwright | | Anthropic Computer Use | API officielle | Pay per token | Plus puissant pour les complexes | | Skyvern | Open-source | Gratuit + cloud | Spécialisé scraping | | Multi-on | SaaS | 30 dollars/mois | Plus simple, pour non-devs |
Les cas d'usage qui rapportent vraiment
1. Scraping résistant aux changements
Votre veille concurrentielle se base sur 20 sites. Tous les mois, certains changent de design et cassent vos scripts. Avec Browser Use + Claude, vous décrivez "récupère les prix de la page produit", peu importe le HTML. Maintenance divisée par 10.
2. Soumission de formulaires complexes
Déclaration administrative, inscription sur portails légaux, soumission d'AO sur des plateformes publiques. Tout ça avec des formulaires multi-pages, captchas mineurs, conditions à valider. L'agent gère.
3. Tests E2E intelligents
Vos tests Cypress demandent 200 lignes de code par parcours utilisateur. Un agent IA fait "teste l'inscription, le paiement et l'envoi du mail de confirmation" en 4 lignes, et s'adapte aux changements de UI mineurs.
4. Onboarding de comptes multiples
Nouveau client : créer un compte sur 7 plateformes, configurer des permissions, générer des API keys. 45 minutes humaines, 5 minutes en automatisation IA.
5. Migration de données entre apps sans API
Votre client veut quitter SaaS A pour SaaS B, mais A n'a pas d'export propre. L'agent navigue, copie, colle, structure. Travail "impossible" devenu trivial.
Construire votre premier agent browser
Voici un exemple concret avec Browser Use, l'outil le plus populaire en open-source.
Installation
pip install browser-use playwright
playwright install chromium
Premier script : récupérer les actualités d'un concurrent
from browser_use import Agent
from anthropic import AsyncAnthropic
async def main():
agent = Agent(
task="Va sur lenobot.com/blog, liste les 5 derniers articles avec titre et date",
llm=AsyncAnthropic(),
model="claude-sonnet-4-7-20260315"
)
result = await agent.run()
print(result)
C'est tout. L'agent ouvre Chromium, navigue, lit, structure, et vous renvoie un JSON propre.
Tâche plus complexe : surveillance de prix
agent = Agent(
task=(
"Connecte-toi sur amazon.fr avec les credentials "
"fournis. Va dans 'Mes listes', ouvre la liste 'Veille'. "
"Pour chaque produit, note prix actuel et stock. "
"Renvoie un JSON."
),
sensitive_data={"email": "...", "password": "..."},
llm=...
)
Coût type
Une tâche moyenne (15 actions, 8 screenshots) coûte environ 0,20 à 0,50 euro en API Claude. Pour 100 exécutions par jour, comptez 30 à 60 euros mensuels. Largement rentable comparé à 4 heures de dev par mois pour maintenir un script Selenium classique.
💡 Vous voulez automatiser un site web complexe chez vous ? On en discute 15 minutes en visio ou téléphone : rdv.lenobot.com.
L'architecture pro pour la production
Un POC sur votre laptop, c'est sympa. En production, voici ce qui tient.
Queue (BullMQ, Redis) reçoit les jobs
↓
Workers Browser Use containerisés (Docker)
↓
Navigateur isolé par job (Browserbase ou Steel.dev)
↓
LLM (Claude Sonnet 4.7 via API)
↓
Résultats stockés (Postgres ou S3)
↓
Monitoring (Langfuse) + alerting (Sentry)
Les services qui simplifient la vie
- Browserbase : navigateurs cloud à la demande, captchas gérés, 0,10 dollar par minute
- Steel.dev : alternative open-source, similaire à Browserbase
- Brightdata Scraping Browser : pour scraping à grande échelle avec rotation IP
- Anchor Browser : version managée, intégration native LLMs
Les pièges techniques à connaître
Captchas
Cloudflare Turnstile et reCAPTCHA v3 restent un mur. Browser Use et Computer Use n'aideront pas à les contourner (et tant mieux). Solutions légitimes : whitelister vos IPs avec le site cible, utiliser leur API si elle existe, ou passer par un service comme Browserbase qui gère certains cas.
Détection de bot
Les sites modernes détectent les patterns non-humains : clics trop précis, absence de mouvement souris, fingerprint navigateur suspect. Browser Use simule du comportement humain, mais sur les sites les plus protégés (Instagram, Facebook), c'est complexe.
Coûts qui dérapent
Un agent qui boucle peut consommer 10 dollars en 5 minutes. Toujours mettre une limite de tokens et un timeout dur.
Fragilité aux refontes
Même l'IA peut être déstabilisée par un site totalement repensé. Prévoyez du monitoring sur les outputs et des tests synthétiques quotidiens.
Conformité légale en 2026
La browser automation soulève de vraies questions juridiques. Voici les règles de base pour ne pas finir au tribunal.
- CGU des sites cibles : la plupart interdisent le scraping, mais l'application est variable selon les pays
- Données personnelles : RGPD s'applique dès que vous récupérez des emails ou noms
- Anti-circumvention : contourner une mesure technique de protection (DRM, API limit) peut être pénal
- Décision Hi-Q vs LinkedIn 2024 (US) : le scraping de données publiques est licite, mais le contexte EU est plus strict
- Toujours préférer l'API : si le site offre une API, utilisez-la, c'est plus stable et plus sûr juridiquement
Notre règle interne : on ne scrape jamais ce qu'un humain ne pourrait pas voir avec un compte standard, et on respecte les robots.txt.
Cas réel : automatisation d'un suivi e-commerce
Un client B2B distribue 500 produits sur 3 marketplaces (Amazon, Cdiscount, Manomano). Chaque jour il faut vérifier prix, stock, commentaires. Avant : 2 personnes pendant 3h chacune. 30 heures par semaine.
Après Browser Use + n8n :
- Job quotidien à 6h, 45 minutes d'exécution
- 1 500 fiches vérifiées, 12 anomalies remontées en moyenne
- Coût mensuel : 180 euros (Browserbase + Claude)
- Économie : 30h/semaine soit environ 24 K euros annuels
ROI atteint en 6 semaines.
Le verdict
La browser automation pilotée par IA est devenue en 2026 un outil quotidien, plus du domaine de la R&D. Elle remplace avantageusement les scripts fragiles, ouvre des automatisations impossibles avant, et démocratise des cas d'usage réservés jusqu'ici aux équipes data.
À retenir : Si vous avez un script Selenium qui casse régulièrement, ou un process manuel impliquant un site sans API, votre prochaine itération doit être un agent browser IA. Coût initial faible, gain de maintenance énorme.
Prêt à automatiser des sites web dans votre business ? Notre équipe vous accompagne de la stratégie à l'implémentation. Réservez votre appel découverte gratuit sur rdv.lenobot.com, 15 minutes pour comprendre votre besoin, devis ferme sous 48h, sans engagement.
Article rédigé par L'équipe Lenobot.
Besoin d'aide avec votre projet ?
Nos experts sont prêts à vous accompagner dans votre transformation digitale.
Discutons de votre projet