Comment calculer la taille d’un échantillon pour une enquête de suivi-évaluation

Déterminer la bonne taille d’échantillon pour une enquête de suivi-évaluation est l’une des décisions méthodologiques les plus structurantes d’un projet. Sous-dimensionné, votre échantillon produit des résultats non significatifs que le bailleur contestera. Sur-dimensionné, il mobilise des ressources que vous n’avez pas. Ce guide détaille les formules, les ajustements terrain et les outils pour atteindre la bonne taille dès la première fois.

1. Pourquoi la taille d’échantillon est un enjeu stratégique, pas seulement statistique

Dans les projets de développement financés par la BAD, l’UE, le PNUD ou Expertise France, la méthodologie d’échantillonnage fait partie des éléments examinés lors de la revue des rapports d’évaluation. Un échantillon mal dimensionné peut amener le commanditaire à rejeter les conclusions ou à demander une enquête complémentaire.

Au-delà de la crédibilité scientifique, la taille de l’échantillon détermine directement :

Le nombre d’enquêteurs à recruter et former ;
Le nombre de jours de collecte sur le terrain ;
Le coût total de la ligne « enquête » dans votre budget ;
La précision des indicateurs clés que vous présenterez dans le rapport final.

Conseil pratique : Présentez toujours le calcul de votre échantillon dans la note méthodologique. Un bailleur qui voit une formule documentée avec ses paramètres aura confiance dans les résultats, même avec un n modéré.

2. Les trois paramètres qui définissent votre taille d’échantillon

Avant d’appliquer toute formule, vous devez fixer trois valeurs. Ce sont elles qui pilotent le résultat.

Le niveau de confiance (Z)

Il exprime votre certitude que les résultats de l’échantillon reflètent bien ceux de la population entière :

90 % de confiance → Z = 1,645
95 % de confiance → Z = 1,96 (le plus courant en S&E)
99 % de confiance → Z = 2,576

La grande majorité des projets BAD, USAID et UE retiennent 95 % de confiance. C’est le seuil à utiliser par défaut sauf instruction contraire des TDR.

La marge d’erreur acceptable (e)

Combien d’écarts acceptez-vous entre votre résultat et la réalité terrain ?

±5 % (e = 0,05) : seuil standard pour les enquêtes auprès des ménages ;
±10 % (e = 0,10) : acceptable pour les évaluations rapides ou les contextes à faible budget ;
±3 % (e = 0,03) : réservé aux études à haute précision (enquêtes nutritionnelles, essais cliniques).

La prévalence estimée (p)

C’est la proportion attendue de l’indicateur principal dans la population. Si vous ne disposez d’aucune donnée de base, utilisez p = 0,5 : cette valeur maximise la variance et vous place dans le cas le plus sûr.

Astuce : Si vous disposez de données de base (baseline, rapport annuel, statistiques nationales), utilisez-les. Une prévalence de 0,3 ou 0,7 réduira significativement la taille requise et économisera des ressources terrain.

3. La formule de calcul — étapes détaillées

Formule de base (population infinie ou > 10 000 personnes)

Appelée formule de Schwartz dans le contexte francophone ou formule de Cochran dans la littérature anglophone :

n₀ = Z² × p × (1 − p) / e²

Applications avec les paramètres standard :

Z = 1,96 | p = 0,5 | e = 0,05 → n = 384 personnes
Z = 1,96 | p = 0,5 | e = 0,10 → n = 97 personnes
Z = 1,96 | p = 0,3 | e = 0,05 → n = 323 personnes
Z = 2,576 | p = 0,5 | e = 0,05 → n = 664 personnes

Ce résultat est votre échantillon théorique de départ. Vous allez l’ajuster aux étapes suivantes.

Correction pour population finie (N < 10 000 personnes)

Quand votre population cible est limitée — bénéficiaires d’un projet dans un district, membres d’une coopérative, agents de santé d’une région — la formule de base surestime le nécessaire :

n’ = n₀ / (1 + (n₀ − 1) / N)

Exemple concret : un projet eau et assainissement au Burkina Faso cible 2 500 ménages bénéficiaires dans trois communes. n₀ = 384.

n’ = 384 / (1 + 383 / 2 500) = 384 / 1,153 ≈ 333 ménages

Vous économisez 51 passages terrain sans sacrifier la représentativité.

Conseil pratique : La correction de Cochran est souvent négligée dans les rapports d’évaluation de projets communautaires. Documentez-la systématiquement — elle montre votre rigueur et justifie un budget terrain réduit.

4. Ajustements indispensables avant le terrain

Compenser les non-réponses

Même avec le meilleur protocole, une partie des personnes sélectionnées sera absente, refusera ou sera inaccessible. Ne partez jamais sur le terrain avec exactement le n calculé.

n_ajusté = n’ / (1 − taux de non-réponse estimé)

Valeurs de référence en contexte africain :

Milieu urbain : 10 à 15 % de non-réponse → multiplier n par 1,12 à 1,18
Milieu rural accessible : 15 à 20 % → multiplier n par 1,18 à 1,25
Zone d’accès difficile (post-conflit, zones frontalières) : 25 à 40 % → multiplier n par 1,33 à 1,67

Tenir compte de l’effet de grappe (DEFF)

Si votre échantillonnage est organisé en grappes, les réponses à l’intérieur d’une même grappe tendent à se ressembler et réduisent l’information effective de votre échantillon.

n_grappes = n_ajusté × DEFF

Valeurs indicatives selon les enquêtes MICS/UNICEF et EDS : DEFF = 1,5 à 2,0 pour les enquêtes ménages en milieu rural africain. En l’absence de données antérieures, utilisez DEFF = 1,5 par prudence.

Exemple cumulé : projet éducation au Sénégal, 4 200 ménages, échantillonnage en grappes, milieu rural semi-enclave :

n₀ = 384 (formule de base)
Correction Cochran : 384 / (1 + 383/4200) = 352
Non-réponse 20 % : 352 / 0,80 = 440
DEFF 1,5 : 440 × 1,5 = 660 ménages

C’est la taille réelle que votre équipe terrain doit atteindre pour garantir la validité statistique.

5. Choisir la méthode d’échantillonnage adaptée à votre contexte

La taille est nécessaire, la méthode de tirage est tout aussi critique. Un bon n mal tiré donne un échantillon biaisé.

Méthodes probabilistes (recommandées pour les rapports bailleurs)

Échantillonnage aléatoire simple : idéal quand vous disposez d’une liste complète des bénéficiaires. Chaque individu a la même probabilité d’être sélectionné.
Échantillonnage stratifié : diviser la population en sous-groupes (zones, genre, tranche d’âge) puis tirer aléatoirement dans chaque strate. Garantit la représentativité de groupes qui seraient sinon sous-représentés.
Échantillonnage en grappes : tirer aléatoirement des unités de premier niveau (villages, écoles, centres de santé), puis enquêter à l’intérieur. Très utilisé en Afrique subsaharienne pour des raisons logistiques et de coût.

Méthodes non probabilistes (contextes spécifiques)

Échantillonnage raisonné (purposif) : sélection délibérée d’individus clés selon des critères prédéfinis. Accepté pour les volets qualitatifs ou les enquêtes auprès d’informateurs clés.
Boule de neige : chaque participant identifie d’autres participants. Adapté aux populations difficilement accessibles. À documenter explicitement avec ses limites.

Astuce : Les TDR BAD et PNUD précisent souvent la méthode attendue. En l’absence d’instruction, privilégiez l’échantillonnage stratifié à deux niveaux (strate géographique + strate genre) : il offre le meilleur équilibre entre rigueur et faisabilité terrain.

6. Outils pour automatiser le calcul sans se tromper

Tableurs (Excel, Google Sheets) : créez une feuille paramétrée avec Z, p, e et N comme variables. Vous obtenez n₀, n’ et n_ajusté instantanément, dans un fichier vérifiable et reproductible par le bailleur.
G*Power (logiciel gratuit) : calcul de puissance statistique pour les protocoles expérimentaux. Indispensable pour les évaluations d’impact randomisées.
OpenEpi et EpiInfo : outils open source OMS/CDC, adaptés aux enquêtes en santé publique et nutrition (projets GAVI, Fonds mondial, USAID/PMI).
KoboToolbox : en plus de la collecte terrain, son module de conception aide à structurer l’échantillonnage. Pour aller plus loin dans vos outils S&E, consultez notre guide des outils essentiels pour le suivi-évaluation de projets.

Un échantillon bien dimensionné, c’est une évaluation que le bailleur ne peut pas contester

La taille de l’échantillon n’est pas un détail que l’on règle à la dernière minute. C’est une décision qui conditionne la crédibilité de tout votre rapport final. En maîtrisant les formules de Schwartz et Cochran, les ajustements pour non-réponse et effets de grappe, et les critères de choix de méthode, vous disposez d’une base solide et documentée pour toutes vos enquêtes de suivi-évaluation.

Pour aller plus loin sur la préparation de vos données après collecte, découvrez les 5 meilleurs outils pour nettoyer les données en suivi-évaluation et optimisez la qualité de vos analyses avant restitution aux bailleurs.