Le sondage se convertit progressivement en un instrument scientifique reposant sur le principe de la représentativité et la technique de l'échantillonnage. Pour échantillonner, les sondeurs opèrent une sélection d'un certain nombre d'individus avant que les enquêteurs ne les interrogent à partir d'un questionnaire. Cette sélection doit respecter un principe, celui de la représentativité à savoir représenter la société française (une France « en miniature »). Les sondeurs peuvent choisir entre deux méthodes : la méthode aléatoire reposant sur une sélection réalisée au hasard et la méthode des quotas vise à reconstituer un échantillon représentatif de la société française en interrogeant une partie ou fraction de la population représentative en termes de structure socioprofessionnelle (sexe, âge, statut socio-professionnel, lieu de résidence, etc.) de la population globale du pays ou de ses électeurs (pour les sondages de nature politique). Un institut de sondage doit par exemple interroger dans son échantillon, 51,62 % de femmes, 14,33 % d'individus âgés de 15 à 24 ans, 5,28 % d'artisans, commerçants et chefs d'entreprise ou encore 33 % d'individus vivant dans des communes rurales si il souhaite que son sondage soit parfaitement représentatif de la société française. Les données présentés ci-dessous, issues du dernier recensement de l'INSEE, correspondent ainsi aux quotas utilisés par les sondeurs pour construire un échantillon représentatif.
Les résultats obtenus sur une partie d'une population représentative peuvent ensuite être considérés comme valables pour l'ensemble de la population grâce à la loi des grands nombres. En effet, plus la taille de l'échantillon est grande et plus les résultats de l'échantillon sont en termes de probabilités proches des résultats de la population totale. La précision du sondage menée par les sondeurs dépend donc du nombre de personnes interrogées. Plus le nombre de personnes interrogées est élevé et plus la précision du sondage en sera élevée sachant qu'un échantillon représentatif robuste est généralement composé d'au moins un millier de personnes. Le sondage est toujours mesuré en prenant en compte une marge d'erreur (obligatoirement mentionnée lors de la publication d'un sondage), son résultat se situe toujours dans un certain intervalle de confiance. Pour mille personnes, la marge d'erreur est de plus ou moins 3 % et pour 10 000 personnes, elle atteint plus ou moins 1 %.
Le sondage est une méthode statistique visant à mesurer quantitativement, à une date déterminée, des opinions, souhaits, attitudes ou comportements politiques (sondage électoral) ou non (sondage d’opinion) d’une population par l’interrogation d’un échantillon. Le caractère scientifique du sondage ne doit toutefois pas être surestimé car celui-ci reste principalement un produit commercial entre un prestataire (institut de sondage, entreprise) et un client (parti politique, gouvernement, entreprise, ONG, etc.). Il fait partie du secteur des études de marché et de sondages qui rassemble plus de 2 000 entreprises, une dizaine d'instituts de sondage, et un chiffre d'affaires de 2 milliards d'euros. Ces relations commerciales peuvent avoir des conséquences dans le sondage sur les questions posées ou la formulation des questions posées : ne risquent-elles pas de n’intéresser que les médias ou certains partis politiques. Ne risquent-elles pas aussi d’influencer la façon de poser les questions ?
La construction de l'échantillon est cruciale quant à la fiabilité du sondage. Si ce dernier repose sur les quotas mentionnées par l'INSEE (sexe, âge, statut socio-professionnel, lieu de résidence, etc.), certaines catégories à partir desquelles sont construites les échantillons font l'objet de débats telle que la catégorie d'ouvriers dans laquelle les résultats seront différents entre un ouvrier qualifié et un ouvrier non qualifié. De plus, il peut être difficile et coûteux pour les sondeurs d’adapter la nature de l’échantillon et sa taille à la question posée (thème qui peut ne concerner que les femmes ou que les hommes, que les jeunes, etc.). Plus globalement, les échantillons sont considérés comme étant de moins en moins représentatifs de la société française en raison du poids accordé aujourd'hui aux enquêtes menées sur Internet, bien moins qualitatives que les enquêtes menées par téléphone ou en face à face. En effet, les access panelssont souvent accusés de dénaturer la fiabilité du sondage, le sondé n'est plus trouvé au hasard par un enquêteur mais il s'inscrit lui-même sur des panels pour répondre à des questionnaires en échange de quelques centimes d'euros. On comprend donc que le degré de sincérité ou de représentativité des réponses peut être faussé.
Des biais peuvent aussi apparaître dans le sondage. Ils peuvent, d'une part, exister dans la formulation des questions (questions plus ou moins fermées ou ouvertes), le choix du vocabulaire employé (termes flous, péjoratifs, mélioratifs), ou l'enchaînement des questions (questions orientées). A titre d'exemple, le documentaire Secrets de sondage diffusé sur France 2 le 13 avril 2017 montre que deux formulations en apparence proches peuvent produire des résultats distincts. A la question « Êtes-vous personnellement favorable à l'accueil par la France de milliers de migrants en provenance du Moyen-Orient et d'Afrique ? », 64 % des individus interrogés sont « défavorables » tandis que si on demande à ces mêmes individus « Êtes-vous personnellement favorable à l'accueil par la France de familles de réfugiés qui fuient la guerre et les massacres dans leur pays d'origine ? », le résultat tombe à 47 % d'individus défavorables. Les biais peuvent aussi apparaître dans la situation d'enquête, l’interaction avec l'enquêteur peut-être génératrice de ce que certains sociologues appellent violence symbolique et conduire à des stratégies de contournement : l'enquêté peut manquer de sincérité ou adopter une réponse conformiste et attendue par l'enquêteur. Par exemple, pendant longtemps en France les enquêtés n’osaient pas affirmer devant un enquêteur vouloir voter pour le Parti communiste ; dans les année 1980, c’était le vote pour le Front national qui n’était pas avoué. Dans les années 1980, le CREDOC posait régulièrement une question relative à un amendement fictif à ses enquêtés « Avez-vous entendu parler de l'amendement Bourrier sur la sécurité sociale ? », moins d'un dixième de l'échantillon prétendait en avoir entendu parler !
Le sondage doit aussi respecter une marge d'erreur.Les résultats d'un sondage se placent toujours dans une « fourchette » appelée intervalle de confiance : il y a 95 % de chances qu'un candidat atteigne un résultat compris dans un intervalle entre deux valeurs. En prenant les résultats du sondage Ipsos-Sopra Steria réalisé sur internet entre le 2 et le 4 avril 2022 auprès d'un échantillon représentatif de 12 600 individus, on apprend qu'avec un résultat estimée à 26,5 % des suffrages exprimés et une marge d'erreur de +/- 0,9%, le résultat final auquel le candidat Emmanuel Macron pouvait prétendre était compris entre 25,6 % et 27,4 %. Il obtient finalement 27,85 % des suffrages exprimés selon les résultats officiel du Ministère de l'Intérieur, soit un résultat proche des marges d'erreur annoncées. Or, dans certaines situations la marge d'erreur peut avoir plusieurs effets sur les résultats des élections. Deux candidats dont les estimations sont proches peuvent voir leur ordre d'arrivée modifié (lors de l'élection européenne de 2019, les Écologistes étaient finalement arrivés devant Les Républicains). Il faut donc se garder d’interpréter de manière trop rapide les résultats brut d’un sondage. Les estimations des candidats peuvent aussi être surestimées (la candidate Valérie Pécresse avec 4,78 % des suffrages exprimés se trouvait 3,12 points en dessous de la marge d'erreur) ou sous-estimées (le candidat Jean-Luc Mélenchon avec 21,95 % des suffrages se plaçait quant à lui à 5,15 points au-dessus de la marge d'erreur).
Pour produire un sondage de qualité et éviter ces écueils méthodologiques et le diffuser de manière rigoureuse, la loi du 19 juillet 1977, récemment modifiée en 2016, prévoit que la publication des sondages soit obligatoirement accompagnée d'une notice mentionnant le commanditaire du sondage, sa méthodologie (taille de l’échantillon, méthode utilisée, mode d'administration du questionnaire, date), la marge d'erreur, le questionnaire, les redressements de l’échantillon (pour tenir compte des estimations de sous-déclarations ou sur-déclarations pour certains partis politiques par exemple). Ces notices sont rendues publiques et accessibles sur le site de la Commission des sondages.
Des critiques théoriques sont apparues afin de ne pas surestimer l'opinion publique sondagière telles que celles formulées par Pierre Bourdieu dans son célèbre article de 1973 intitulé « l'opinion publique n'existe pas ». Il s'appuie sur trois postulats pour démontrer le caractère artificiel du sondage. Il explique tout d'abord que tout le monde ne peut pas avoir une opinion. En effet, la capacité à donner son avis sur un sujet n'est pas universellement partagée et dépend du capital culturel et de la socialisation de l'individu. Il peut être difficile pour un individu de répondre à des questions complexes, techniques, précises souvent déconnectées de son domaine d'activité et de ses centres d'intérêt (faut-il modifier la politique monétaire de la BCE pour lutter contre l'inflation ?) Ensuite, toutes les opinions ne se valent pas. Cela signifie que le sondage participe à une mise en équivalence des opinions de poids inégales, il rassemble des opinions de natures différentes : celles d'individus informées, politisés et mobilisées, mais aussi des opinions sollicitées et provoquées (l'individu sommé de répondre aux questions posées répond au hasard sans réelle conviction afin de ne pas « perdre la face »). Enfin, le sondage repose sur l'idée qu'il existerait un consensus sur les questions posées. Il y aurait un accord implicite sur les questions qui méritent d'être posées alors que les questions posées seraient essentiellement celles qui intéressent les décideurs politiques et économiques. Le sondage considère l'opinion publique uniquement comme une simple somme d'opinions individuelles transformées en opinions collectives et réduite à un pourcentage alors qu'elle correspond davantage à une dynamique sociale marqué par des conflits (« un système de forces, de tensions » pour Pierre Bourdieu) dans laquelle interagissent des organisations politiques, syndicales, associatives, des « leaders d'opinion » et des médias : l’opinion publique suppose un jugement à partir de débats publics, d’arguments échangés. De ce point de vue, les sondages apparaissent plus comme des opinions privées, révélées publiquement par les sondeurs, que comme des révélateurs d’une opinion publique.