Combien de mots compte mon texte ?

Tapez ou collez votre texte dans le champ de saisie en haut. Le compteur de mots met à jour le nombre de mots en direct à chaque frappe — vous n'avez pas à cliquer sur un bouton. En arrière-plan tourne une séparation de mots sensible à la langue qui compte un seul mot pour les mots composés français comme « anticonstitutionnellement », et non quatre.

Combien de caractères peut avoir un post X ?

X autorise 280 caractères pour un post gratuit. Le compteur de mots affiche en bas une barre de progression pour X qui tourne en direct et marque l'espace restant à 280 caractères. Avec X Premium, jusqu'à 25 000 caractères par post sont autorisés — l'affichage standard reste cependant à 280, car c'est la limite pertinente pour la portée.

Comment le compteur estime-t-il les tokens IA ?

L'estimation utilise un facteur de conversion typique : environ 4 caractères par token pour le texte anglais et environ 3,5 caractères par token pour le texte français. Les accents français et les conjugaisons complexes consomment plus de tokens par lettre que les textes anglais. L'estimation se situe dans nos échantillons à ±15 % de la tokenisation réelle — suffisant pour décider si un texte tient dans la fenêtre de contexte 8k, 32k ou 128k d'un assistant IA.

Combien de temps pour lire un texte ?

Hypothèse standard : 238 mots par minute en lecture silencieuse — c'est la médiane de la [méta-analyse de Marc Brysbaert (2019)](https://doi.org/10.1016/j.jml.2019.104047) sur 190 études de lecture. Dans l'onglet « Statistique », la vitesse peut être réglée à 150 (lent) ou 300 mots par minute (rapide). Le temps de parole est fixé à 150 mots par minute — c'est l'ordre de grandeur TED Talk.

Que signifie densité de mots-clés et quand est-elle trop élevée ?

La densité de mots-clés est la part d'un mot ou d'une phrase dans le texte total. Pour les textes SEO s'applique : un terme principal dans la fourchette 1–3 % est généralement discret, tout au-dessus de 5 % semble du keyword stuffing. Le compteur de mots liste les dix termes les plus fréquents et les regroupe sur demande en phrases de deux ou trois mots. Les mots vides comme « le », « la », « et » sont filtrés par défaut, car ils domineraient sinon le top.

Le compteur de mots est-il privé — où reste mon texte ?

Votre texte reste dans l'onglet du navigateur. Pas d'upload serveur, pas de cookies, pas d'analytics, pas de `localStorage`. Si vous fermez l'onglet, le texte disparaît — c'est intentionnel. Le bouton « Copier le résumé » fonctionne aussi purement en local via l'[API Clipboard](https://developer.mozilla.org/fr/docs/Web/API/Clipboard_API). Du point de vue RGPD, le compteur de mots ne traite pas de données personnelles au sens de l'art. 4, car le traitement a lieu en local sur votre appareil.

Le compteur reconnaît-il les mots composés ?

Oui. Le compteur de mots utilise la séparation de mots sensible à la langue intégrée au navigateur — la même qu'utilisent les traitements de texte et les traducteurs de navigateur. Les longs mots comme « anticonstitutionnellement » ou « otorhinolaryngologiste » sont comptés comme UN mot. Une heuristique supplémentaire décompose les mots à partir de 12 lettres en leurs composants probables — pratique si vous voulez savoir de combien de morphèmes un mot est composé.

Quelles sont les limites GSM-7 et Unicode SMS ?

Un SMS classique au standard GSM-7 contient 160 caractères. Dès que le message contient des accents (é, à, ç, ô) ou des emojis, l'encodage passe à Unicode et la limite tombe à 70 caractères par SMS individuel. Les messages plus longs sont fragmentés en SMS multipart ; chaque partie perd alors des caractères supplémentaires pour l'en-tête. Le compteur de mots affiche la limite standard de 160 avec une indication sur la réduction Unicode.

Combien de mots compte un mémoire de master ?

Un mémoire de Master en France compte typiquement 50 000 à 80 000 caractères (≈ 20 000 à 30 000 mots, soit 80–120 pages de texte courant). Les mémoires de Licence font 25 000 à 50 000 caractères (10 000 à 20 000 mots), les thèses de doctorat 200 000 à 800 000 mots. Les exigences concrètes sont dans le règlement de votre formation — ces chiffres ne sont qu'une orientation, en cas de doute les exigences officielles du jury sont contraignantes.

Compter les mots — tokens, temps de lecture et limites en

Qu’est-ce qui rend un bon compteur de mots 2026 différent ?

Un compteur de mots paraît simple au premier regard : prendre le texte, séparer aux espaces, fini. Cette définition s’effondre à chaque changement sérieux de type de texte. Un mot français comme « anticonstitutionnellement » est un mot — les compteurs naïfs ne le séparent pas, mais d’autres outils qui cherchent les traits d’union le séparent à tort. Un tweet anglais avec des hashtags est une autre bête qu’un extrait de papier académique. Et un historique de chat que vous voulez verser dans un assistant IA ne compte pas en mots, mais en tokens.

Ce compteur de mots résout les trois problèmes à la racine. La reconnaissance de mots tourne via la segmentation Unicode de mots intégrée au navigateur, qu’utilisent aussi les traducteurs de navigateur et les traitements de texte. Elle connaît les accents français, les umlauts allemands, les frontières de caractères chinois et les mots anglais avec apostrophe. L’estimation de tokens IA utilise un facteur de conversion empirique par langue — et visualise immédiatement si votre texte tient dans une fenêtre de contexte 4k, 8k, 32k ou 128k. Les limites de plateforme sont arrangées comme barres de progression en direct à côté de l’éditeur de texte, de sorte que vous voyez en tapant combien d’espace il vous reste.

En quoi le compteur diffère-t-il de Word et Google Docs ?

Microsoft Word et Google Docs comptent les mots de manière fiable, mais seulement comme prestation secondaire dans un traitement de texte de cinq cents mégaoctets. Ils ne sont pas conçus pour vérifier un texte sur l’aptitude X, les limites Bluesky ou la lisibilité LinkedIn. Ils n’affichent pas non plus le temps de lecture. Word livre avec « Langue et style » un indice de lisibilité assez basique (Flesch Reading Ease, variante anglais US), mais sans adaptation linguistique pour textes français.

Le compteur de mots spécialisé peut quelque chose qu’un éditeur universel n’essaie pas : il travaille consciemment plateforme. L’éditeur d’entrée est un unique grand textarea qui s’adapte à la taille d’écran. Directement en dessous, huit tuiles en direct comptent par frappe. Dans l’onglet « Limites de plateforme », vous voyez immédiatement si votre texte tient encore sous 280 caractères X ou a déjà dépassé la limite LinkedIn de 3000. Dans l’onglet « Tokens IA » se trouve un nombre de tokens estimé plus un affichage à quatre pilules : tient en 4k, 8k, 32k, 128k. Cette tâche n’est prise en charge par aucun traitement de texte classique.

Pourquoi ai-je besoin d’une estimation de tokens pour les assistants IA ?

Les assistants IA traitent le texte non pas en mots ou caractères, mais en tokens. Un token est une unité de sous-mot que le modèle respectif a apprise pendant l’entraînement. Les mots anglais comme « cat » ou « run » sont souvent un seul token. Les mots anglais plus longs comme « extraordinary » sont décomposés en trois ou quatre tokens. Les mots français à conjugaison complexe sont particulièrement coûteux — « anticonstitutionnellement » peut facilement occuper six ou sept tokens, car le tokeniseur n’a jamais vu exactement ce mot et doit le composer pièce par pièce à partir de son vocabulaire de sous-mots.

Quand vous copiez un texte dans un assistant IA, la taille de la fenêtre de contexte est décisive. Les tailles courantes sont 4 000, 8 000, 32 000 et 128 000 tokens. Le compteur de mots utilise un facteur de conversion empirique — environ 4 caractères par token en anglais et environ 3,5 en français — et affiche immédiatement dans quelle catégorie tombe votre texte. C’est assez précis pour prendre une décision (« est-ce que ça tient dans un prompt 8k ou dois-je raccourcir ? ») et en même temps léger : le navigateur n’a pas à charger de modèle de tokenisation.

Que dit l’indice de lisibilité ?

Dans l’onglet « Statistique » se trouve à côté des tuiles en direct une valeur de lisibilité sur une échelle de 0 à 100. Les valeurs plus élevées signifient texte plus facile. Pour les textes français, le compteur de mots utilise une adaptation de la formule Flesch ajustée au français, calibrée sur la longueur de phrase moyenne plus élevée en français. Pour les textes anglais, le Flesch Reading Ease classique (1948) est utilisé.

Les deux échelles sont compatibles : 60 à 70 correspond au niveau scolaire, 30 à 50 fait académique, sous 30 est jargon spécialisé, plus de 80 est lecture facile pour jeunes lecteurs. Un score très bas n’est pas automatiquement un problème — les textes spécialisés doivent sonner ainsi — mais quand un texte marketing atterrit sous 40, cela vaut la peine de vérifier la longueur de phrase. Les deux mini-tuiles « Longueur moyenne de mot » et « Longueur moyenne de phrase » montrent les leviers directs.

Comment fonctionnent les limites de plateforme ?

Dans l’onglet « Limites de plateforme » se trouvent huit plateformes avec leurs limites officielles de caractères : X avec 280, Bluesky avec 300, Instagram avec 2200 (avec un soft-cut supplémentaire à 125 caractères, où la légende est tronquée par « plus »), LinkedIn avec 3000, TikTok avec 4000, titre Google avec 60, meta-description Google avec 160 et le SMS GSM-7 classique avec 160 caractères.

Chaque plateforme reçoit une barre de progression horizontale. Tant que vous êtes dans la zone verte, la barre se remplit dans la couleur graphite-tokens normale. Dès que vous dépassez la limite, la barre passe au rouge rouille-token et le compteur à droite affiche « plus de X caractères ». Pour Instagram, la barre dessine une marque tick supplémentaire à 125 caractères — c’est l’endroit où Instagram tronque la légende dans le feed.

À quel point la reconnaissance de mots composés est-elle fiable ?

Le segmenteur de mots intégré au navigateur connaît les mots français composés comme un mot — c’est le consensus parmi tous les moteurs de navigateur modernes. Plus difficile est la question suivante : de combien de composants se compose un long mot ? « Anticonstitutionnellement » est morphologiquement trois morphèmes : anti + constitutionnel + lement (avec préfixe et suffixe). Une analyse morphologique complète a besoin d’un dictionnaire qui coûte trop de bande passante dans le navigateur.

Le compteur de mots utilise donc une heuristique : les mots à partir de 12 lettres sont sondés pour des coupures CamelCase et des suffixes français (-ment, -tion, -ité, -isme, -able, -ique). La reconnaissance est suffisamment bonne pour marquer visuellement les longs mots et fournir une estimation pour les morphèmes, mais elle ne remplace pas une analyse linguistique. Vous le reconnaissez dans l’UI au fait que l’information morphème est à côté de la grille de tuiles comme affichage détaillé supplémentaire, pas comme nombre principal.

Que se passe-t-il avec de très longs textes ?

Le compteur de mots est écrit de telle sorte qu’un Anna Karénine entier (environ 360 000 mots, 2 millions de caractères) tourne dans le navigateur sans que l’UI ne broute. Le calcul en direct est linéaire dans la longueur du texte et utilise un seul passage sur la chaîne d’entrée. L’évaluation N-Gramme dans l’onglet « Densité de mots-clés » est O(n) avec n = nombre de mots, plus un petit tri à la fin pour le top-10.

Pratiquement cela signifie : pour les tweets jusqu’aux articles de 10 000 mots, vous voyez le résultat sans retard perceptible. Aux longueurs de roman, vous remarquez en tapant sur mobiles une petite inertie, qui disparaît cependant dans les millisecondes. Il n’y a pas de limite supérieure artificielle. Si vous voulez vraiment aller aux limites : un texte de 100 Mo dans le presse-papiers est l’endroit où le navigateur lui-même devient nerveux dès le collage, pas encore le compteur de mots.

Quelles applications cet outil n’est PAS ?

Trois applications sont volontairement hors du scope. Premièrement : pas de vérification grammaire et orthographe. Les correcteurs orthographiques intégrés au navigateur et des outils dédiés comme LanguageTool sont meilleurs pour cela. Deuxièmement : pas d’upload de fichier pour DOCX, PDF ou formats similaires. Qui veut analyser des documents Word les a généralement déjà ouverts dans le traitement de texte et peut copier le contenu. Troisièmement : pas de synchronisation cloud. Votre texte reste dans l’onglet — si vous voulez le conserver, copiez-le vous-même.

Ces lacunes sont intentionnelles. Elles gardent le compteur de mots rapide, léger et privé. Chacune de ces trois fonctions signifierait soit un aller-retour serveur, soit une bibliothèque de 5 à 10 Mo dans le navigateur, soit un cookie pour la connexion cloud — et ce ne serait plus le même onglet dans lequel vous travaillez maintenant.

Et la confidentialité et le RGPD ?

Votre texte reste dans la mémoire du navigateur. Pas de persistance localStorage, pas de cookies, pas d’analytics, pas d’aller-retour serveur. L’onglet fonctionne hors ligne après le chargement initial de la page. Le bouton « Copier le résumé » crée la statistique en texte clair en local via l’API Clipboard et l’écrit dans votre presse-papiers — pas d’appel réseau.

Du point de vue RGPD, le compteur de mots ne traite pas de données personnelles au sens de l’art. 4, car le traitement a lieu en local sur votre appareil. Même si vous insérez des textes sensibles (brouillons d’e-mails, écritures juridiques, comptes rendus médicaux), le texte reste dans l’onglet. Si vous fermez l’onglet, tout disparaît. Cette architecture est explicitement choisie — c’est la raison pour laquelle le compteur de mots est aussi utilisable dans des setups d’entreprise avec exigences strictes de confidentialité.

Compter les mots — tokens, temps de lecture et limites de plateforme en direct

Comment ça marche

Text oder Code einfügen

Automatische Verarbeitung

Ergebnis kopieren

Confidentialité

Comment utiliser cet outil ?