Aller au contenu
OUTIL TEXTE

Compter les mots — tokens, temps de lecture et limites de plateforme en direct

Écrivez ou collez votre texte — mots, caractères, temps de lecture et tokens IA s'actualisent lettre par lettre.

Counted in your browser · no upload · no cookies

Words 0
Characters 0
No spaces 0
Sentences 0
Paragraphs 0
Reading time 0 sec
Speaking time 0 sec
AI tokens (est.) 0
View
Reading speed
Readability 0.0

Scale 0–100 (higher = easier). 60–70 is plain-English textbook level.

Avg. word len. 0.0
Avg. sentence len. 0.0
Lines 0

Reading-time values are based on the meta-analysis of silent reading speed (Brysbaert 2019).

Comment ça marche

  1. 01

    Text oder Code einfügen

    Füge deinen Inhalt in das Eingabefeld ein oder tippe direkt.

  2. 02

    Automatische Verarbeitung

    Das Tool verarbeitet den Inhalt sofort und zeigt das Ergebnis.

  3. 03

    Ergebnis kopieren

    Kopiere das Ergebnis mit einem Klick in die Zwischenablage.

Confidentialité

Alle Berechnungen laufen direkt in deinem Browser. Keine Daten werden auf Server übertragen.

La plupart des compteurs de mots en ligne envoient le texte d'entrée à un serveur ou le jettent après le premier clic. Ce compteur de mots travaille entièrement dans le navigateur, reconnaît les mots composés (« anticonstitutionnellement ») comme un seul mot et estime en plus le nombre de [tokens](https://fr.wikipedia.org/wiki/Tokenisation) qu'un assistant IA consomme pour cela.

01 — Mode d’emploi

Comment utiliser cet outil ?

  1. Tapez ou collez le texte dans le grand champ de saisie — mots, caractères, phrases, temps de lecture et temps de parole s'actualisent en direct.
  2. Bascule d'onglet : Limites de plateforme affiche des barres de progression pour X, Bluesky, LinkedIn, Instagram, TikTok, SMS et Google.
  3. Densité de mots-clés montre les termes et phrases les plus fréquents — les mots vides (« le/la/les ») peuvent être affichés ou masqués.

Qu’est-ce qui rend un bon compteur de mots 2026 différent ?

Un compteur de mots paraît simple au premier regard : prendre le texte, séparer aux espaces, fini. Cette définition s’effondre à chaque changement sérieux de type de texte. Un mot français comme « anticonstitutionnellement » est un mot — les compteurs naïfs ne le séparent pas, mais d’autres outils qui cherchent les traits d’union le séparent à tort. Un tweet anglais avec des hashtags est une autre bête qu’un extrait de papier académique. Et un historique de chat que vous voulez verser dans un assistant IA ne compte pas en mots, mais en tokens.

Ce compteur de mots résout les trois problèmes à la racine. La reconnaissance de mots tourne via la segmentation Unicode de mots intégrée au navigateur, qu’utilisent aussi les traducteurs de navigateur et les traitements de texte. Elle connaît les accents français, les umlauts allemands, les frontières de caractères chinois et les mots anglais avec apostrophe. L’estimation de tokens IA utilise un facteur de conversion empirique par langue — et visualise immédiatement si votre texte tient dans une fenêtre de contexte 4k, 8k, 32k ou 128k. Les limites de plateforme sont arrangées comme barres de progression en direct à côté de l’éditeur de texte, de sorte que vous voyez en tapant combien d’espace il vous reste.

En quoi le compteur diffère-t-il de Word et Google Docs ?

Microsoft Word et Google Docs comptent les mots de manière fiable, mais seulement comme prestation secondaire dans un traitement de texte de cinq cents mégaoctets. Ils ne sont pas conçus pour vérifier un texte sur l’aptitude X, les limites Bluesky ou la lisibilité LinkedIn. Ils n’affichent pas non plus le temps de lecture. Word livre avec « Langue et style » un indice de lisibilité assez basique (Flesch Reading Ease, variante anglais US), mais sans adaptation linguistique pour textes français.

Le compteur de mots spécialisé peut quelque chose qu’un éditeur universel n’essaie pas : il travaille consciemment plateforme. L’éditeur d’entrée est un unique grand textarea qui s’adapte à la taille d’écran. Directement en dessous, huit tuiles en direct comptent par frappe. Dans l’onglet « Limites de plateforme », vous voyez immédiatement si votre texte tient encore sous 280 caractères X ou a déjà dépassé la limite LinkedIn de 3000. Dans l’onglet « Tokens IA » se trouve un nombre de tokens estimé plus un affichage à quatre pilules : tient en 4k, 8k, 32k, 128k. Cette tâche n’est prise en charge par aucun traitement de texte classique.

Pourquoi ai-je besoin d’une estimation de tokens pour les assistants IA ?

Les assistants IA traitent le texte non pas en mots ou caractères, mais en tokens. Un token est une unité de sous-mot que le modèle respectif a apprise pendant l’entraînement. Les mots anglais comme « cat » ou « run » sont souvent un seul token. Les mots anglais plus longs comme « extraordinary » sont décomposés en trois ou quatre tokens. Les mots français à conjugaison complexe sont particulièrement coûteux — « anticonstitutionnellement » peut facilement occuper six ou sept tokens, car le tokeniseur n’a jamais vu exactement ce mot et doit le composer pièce par pièce à partir de son vocabulaire de sous-mots.

Quand vous copiez un texte dans un assistant IA, la taille de la fenêtre de contexte est décisive. Les tailles courantes sont 4 000, 8 000, 32 000 et 128 000 tokens. Le compteur de mots utilise un facteur de conversion empirique — environ 4 caractères par token en anglais et environ 3,5 en français — et affiche immédiatement dans quelle catégorie tombe votre texte. C’est assez précis pour prendre une décision (« est-ce que ça tient dans un prompt 8k ou dois-je raccourcir ? ») et en même temps léger : le navigateur n’a pas à charger de modèle de tokenisation.

Que dit l’indice de lisibilité ?

Dans l’onglet « Statistique » se trouve à côté des tuiles en direct une valeur de lisibilité sur une échelle de 0 à 100. Les valeurs plus élevées signifient texte plus facile. Pour les textes français, le compteur de mots utilise une adaptation de la formule Flesch ajustée au français, calibrée sur la longueur de phrase moyenne plus élevée en français. Pour les textes anglais, le Flesch Reading Ease classique (1948) est utilisé.

Les deux échelles sont compatibles : 60 à 70 correspond au niveau scolaire, 30 à 50 fait académique, sous 30 est jargon spécialisé, plus de 80 est lecture facile pour jeunes lecteurs. Un score très bas n’est pas automatiquement un problème — les textes spécialisés doivent sonner ainsi — mais quand un texte marketing atterrit sous 40, cela vaut la peine de vérifier la longueur de phrase. Les deux mini-tuiles « Longueur moyenne de mot » et « Longueur moyenne de phrase » montrent les leviers directs.

Comment fonctionnent les limites de plateforme ?

Dans l’onglet « Limites de plateforme » se trouvent huit plateformes avec leurs limites officielles de caractères : X avec 280, Bluesky avec 300, Instagram avec 2200 (avec un soft-cut supplémentaire à 125 caractères, où la légende est tronquée par « plus »), LinkedIn avec 3000, TikTok avec 4000, titre Google avec 60, meta-description Google avec 160 et le SMS GSM-7 classique avec 160 caractères.

Chaque plateforme reçoit une barre de progression horizontale. Tant que vous êtes dans la zone verte, la barre se remplit dans la couleur graphite-tokens normale. Dès que vous dépassez la limite, la barre passe au rouge rouille-token et le compteur à droite affiche « plus de X caractères ». Pour Instagram, la barre dessine une marque tick supplémentaire à 125 caractères — c’est l’endroit où Instagram tronque la légende dans le feed.

À quel point la reconnaissance de mots composés est-elle fiable ?

Le segmenteur de mots intégré au navigateur connaît les mots français composés comme un mot — c’est le consensus parmi tous les moteurs de navigateur modernes. Plus difficile est la question suivante : de combien de composants se compose un long mot ? « Anticonstitutionnellement » est morphologiquement trois morphèmes : anti + constitutionnel + lement (avec préfixe et suffixe). Une analyse morphologique complète a besoin d’un dictionnaire qui coûte trop de bande passante dans le navigateur.

Le compteur de mots utilise donc une heuristique : les mots à partir de 12 lettres sont sondés pour des coupures CamelCase et des suffixes français (-ment, -tion, -ité, -isme, -able, -ique). La reconnaissance est suffisamment bonne pour marquer visuellement les longs mots et fournir une estimation pour les morphèmes, mais elle ne remplace pas une analyse linguistique. Vous le reconnaissez dans l’UI au fait que l’information morphème est à côté de la grille de tuiles comme affichage détaillé supplémentaire, pas comme nombre principal.

Que se passe-t-il avec de très longs textes ?

Le compteur de mots est écrit de telle sorte qu’un Anna Karénine entier (environ 360 000 mots, 2 millions de caractères) tourne dans le navigateur sans que l’UI ne broute. Le calcul en direct est linéaire dans la longueur du texte et utilise un seul passage sur la chaîne d’entrée. L’évaluation N-Gramme dans l’onglet « Densité de mots-clés » est O(n) avec n = nombre de mots, plus un petit tri à la fin pour le top-10.

Pratiquement cela signifie : pour les tweets jusqu’aux articles de 10 000 mots, vous voyez le résultat sans retard perceptible. Aux longueurs de roman, vous remarquez en tapant sur mobiles une petite inertie, qui disparaît cependant dans les millisecondes. Il n’y a pas de limite supérieure artificielle. Si vous voulez vraiment aller aux limites : un texte de 100 Mo dans le presse-papiers est l’endroit où le navigateur lui-même devient nerveux dès le collage, pas encore le compteur de mots.

Quelles applications cet outil n’est PAS ?

Trois applications sont volontairement hors du scope. Premièrement : pas de vérification grammaire et orthographe. Les correcteurs orthographiques intégrés au navigateur et des outils dédiés comme LanguageTool sont meilleurs pour cela. Deuxièmement : pas d’upload de fichier pour DOCX, PDF ou formats similaires. Qui veut analyser des documents Word les a généralement déjà ouverts dans le traitement de texte et peut copier le contenu. Troisièmement : pas de synchronisation cloud. Votre texte reste dans l’onglet — si vous voulez le conserver, copiez-le vous-même.

Ces lacunes sont intentionnelles. Elles gardent le compteur de mots rapide, léger et privé. Chacune de ces trois fonctions signifierait soit un aller-retour serveur, soit une bibliothèque de 5 à 10 Mo dans le navigateur, soit un cookie pour la connexion cloud — et ce ne serait plus le même onglet dans lequel vous travaillez maintenant.

Et la confidentialité et le RGPD ?

Votre texte reste dans la mémoire du navigateur. Pas de persistance localStorage, pas de cookies, pas d’analytics, pas d’aller-retour serveur. L’onglet fonctionne hors ligne après le chargement initial de la page. Le bouton « Copier le résumé » crée la statistique en texte clair en local via l’API Clipboard et l’écrit dans votre presse-papiers — pas d’appel réseau.

Du point de vue RGPD, le compteur de mots ne traite pas de données personnelles au sens de l’art. 4, car le traitement a lieu en local sur votre appareil. Même si vous insérez des textes sensibles (brouillons d’e-mails, écritures juridiques, comptes rendus médicaux), le texte reste dans l’onglet. Si vous fermez l’onglet, tout disparaît. Cette architecture est explicitement choisie — c’est la raison pour laquelle le compteur de mots est aussi utilisable dans des setups d’entreprise avec exigences strictes de confidentialité.

Dernière mise à jour :

Vous pourriez aussi aimer