Thomas Piketty, une autorité incontestée ? : mais pourquoi personne ne s’intéresse au débunkage de ses données sur les inégalités ? <!-- --> | Atlantico.fr
Atlantico, c'est qui, c'est quoi ?
Newsletter
Décryptages
Pépites
Dossiers
Rendez-vous
Atlantico-Light
Vidéos
Podcasts
Economie
L'économiste Thomas Piketty lors d'une séance photo pour l'AFP.
L'économiste Thomas Piketty lors d'une séance photo pour l'AFP.
©JOEL SAGET / AFP

Manque de curiosité ?

Outre-Atlantique, de nombreux économistes ont souligné que les données sur lesquelles Thomas Piketty a construit sa grande thèse sur le creusement des inégalités sociales ont mis en lumière les limites et inexactitudes des données statistiques.

Vincent Geloso

Vincent Geloso

Vincent Geloso est professeur adjoint d’économie à George Mason University. Auparavant, il était chercheur postdoctoral à la Texas Tech University. Vincent Geloso est titulaire d’un doctorat en histoire économique de la London School of Economics and Political Science et d’une maîtrise en histoire économique du même établissement. Ses articles scientifiques ont été publiés dans Economic Inquiry, Public Choice, Health Policy & Planning, la Revue canadienne d’économie (CJE), Economics & Human Biology, Southern Economic Journal, Research Policy, European Journal of Law & Economics, International Review of Law & Economics et The Journal of Economic History. Il est également l’auteur du livre Du Grand Rattrapage au Déclin Tranquille, sur l’histoire économique du Québec depuis 1900, publié en 2013.

Voir la bio »

Atlantico Rédaction : Dans sa recension de l’ouvrage de Thomas Piketty et Julia Cagé, Le Monde (où il est chroniqueur et elle présidente de la société des lecteurs) affirme qu’il est l’auteur « d’ouvrages faisant autorité ».

Manque de curiosité…?

Le Monde oublie en effet soigneusement de préciser que les données statistiques sur lesquelles Thomas Piketty a construit ses précédents livres ont largement été débunkées outre-Atlantique…

En résumé, Piketty s’appuie sur des données fiscales américaines dont il a été solidement établi qu’elles étaient incomplètes et donc absolument pas appropriées pour mesurer l’évolution des inégalités de revenus.

Au regard de la place qu’a pris le discours sur le creusement des inégalités dans le débat public (au mépris le plus souvent des faits en ce qui concerne la France), est-il anodin que le « quotidien de référence » n’ait aucun recul critique sur son économiste star… ?

Atlantico : Dans quelle mesure est-ce que les travaux de Zucman (et Piketty et Saez) sont-ils devenus une référence dans leur domaine (et la base de nombreux travaux) ?

Vincent Geloso :Tout d'abord, il est clair que Zucman, Piketty et Saez sont devenus la première source de référence dans leur domaine. Ceci dit, ce n'est pas tant en raison de la qualité, c'est largement en raison de la politisation de leurs travaux. Devenus incontournables dans les débats publics, les économistes universitaires se retrouvent obligés de les citer. Cependant, je vous dis aussi que depuis 10 ans environ, ils ont graduellement perdu en faveur parmi les académiques. Plusieurs travaux ont remis en question la qualité de leurs estimations et plusieurs se sont mis à les critiquer férocement (notamment Larry Summers qui est l'ancien président de l'Université Harvard et Wojtek Kopczuk qui est l'éditeur en chef de Journal of Public Economics). Ainsi, ils sont vus avec une certaine suspicion. Ce qui est particulièrement intéressant, c'est que les critiques couvrent la totalité de l'échiquier politique. Je suis moi-même un libéral de la vieille espèce alors que Summers est un démocrate américain qui est plus centriste alors que d'autres comme Kopczuk et James Galbraith se retrouvent plus à gauche. Avant son décès, il y avait aussi Richard Sutch de UC-Davis (qui avait férocement critiqué Piketty et Saez) qui se situait plutôt à gauche. 

La partie triste de cela c'est que la profession joue un double jeu -- celui de la petite politique et celui du débat académique. Les deux se mélangent fréquemment et c'est pour cela que je pense que Zucman, Piketty et Saez réussissent à s'en sortir avec ce qui aurait coûté la carrière d'un chercheur plus junior ou d'un chercheur "moins à la mode" (voir prochaine réponse). Finalement, il faut ajouter que la majorité des académiques ne parlent pas notre chère langue de Molière. Comme Zucman, Piketty et Saez  se permettent souvent d'exprimer leurs opinions politiques plus extrêmes dans la presse française, les académiciens qui ne connaissent pas le français ne sont pas au courant de l'étendue des biais de Zucman, Piketty et Saez. En conséquent, il est plus difficile d'appliquer un taux d'escompte à leurs arguments/résultats.

Dans quelle mesure cela pose-t-il problème que leur travaux doivent être pris avec autant de précaution que vous le démontrez ?

Vincent Geloso : Zucman, Piketty et Saez se pavanent fréquemment dans les médias. Ainsi, Zucman, Piketty et Saez trouvent souvent des résultats qui frappent l'imaginaire politique. Cependant, lorsqu'on creuse, on réalise qu'ils vont de pair avec l'idéologie qu'ils confessent. Dans mon cas particulier, je vous admet que mes résultats sont en défaut avec mon idéologie. Étant libéral, j'aimerai bien que les tendances d'inégalités n'aient point augmenté depuis 1980. Mais elles ont augmenté. Ceci dit, ce n'est pas vrai que le niveau est plus élevé qu'au sommet des années 1920. Ce n'est pas vrai non plus qu'il y a une explosion des inégalités (elles semblent avoir augmenté beaucoup entre 1970 et 1990 et s'être stabilisées depuis). Il n'est pas vrai que ce sont les vastes augmentations de taxe qui ont permis de réduire les inégalités. Plutôt, il semble que ce nivellement est le résultat de la Grande Dépression et il faut bien admettre que l'égalité grandissante dans la pauvreté grandissante (ce qu'était la Grande Dépression) ne constitue en rien un fait qui mérite d'être répliqué! Ajoutez les nuances que je fais et vous voyez que le résultat époustouflant qui permet à Zucman, Piketty et Saez de s'immiscer dans l'imaginaire collectif disparaît entièrement. Imaginez si ils avaient présenté un résultat plus nuancé (i.e., plus proche de la vérité). Est-ce-que Zucman, Piketty et Saez auraient été aussi présents dans la sphère médiatique? J'en doute fortement. Cependant, c'est pour cela qu'il faut les considérer avec précaution -- ils veulent avoir raison sur deux plans -- a) le plan académique et b) le plan politique. Lorsqu'il y a conflit entre les deux, je pense qu'ils donnent prédominance au second. Zucman, Piketty et Saez vivent bien trop dans la sphère entre la politique (et les politiques qu'ils cotôient) et l'académique. Si je suis partisan de parler à tout le monde (gauche et droite), il faut garder une muraille de Chine entre l'université et les politiques lorsqu'on fait nos recherches. La muraille de Zucman, Piketty et Saez est un fromage gruyère qui est a moitié mangé par les souris!

Vous avez mené différents travaux universitaires critiques de ces analyses dont How Pronounced is the U-Curve? Revisiting Income Inequality in the United States, 1917–60. Que peut-on exactement reprocher aux auteurs ?

Vincent Geloso : Soyons clairs : les travaux de Gabriel Zucman sont à prendre avec des pincettes. En grande partie parce que lui et ses collègues ont été très négligents. Je ne vais pas mâcher mes mots et énumérer la litanie des négligences.

Tout d'abord, vous devez comprendre la chose suivante : le travail de Zucman avec Piketty et Saez s'appuie fortement sur un article publié en 2003 dans le Quarterly Journal of Economics. J'ai réexaminé les données, les hypothèses et les méthodes de cet article dans deux articles publiés - l'un à Economic Inquiry et l'autre à The Economic Journal.

Sans cet article, les autres ne suivent pas. Il s'agit de l'élément de base essentiel et le fait d'y apporter des modifications modifie les autres articles (sur la fiscalité optimale, sur la progressivité, sur l'inégalité des richesses).

Permettez-moi également d'expliquer que lorsque j'ai commencé ces articles avec Phil Magness en 2016, je pensais que nous améliorions simplement une série de données. Cependant, plus je me plongeais dans les détails et les archives, plus je me rendais compte qu'il y avait un immense laisser-aller.

Et je vais me concentrer sur la période antérieure à 1960 parce que David Splinter et Gerald Auten ont montré des problèmes bien plus graves après 1960 que ceux que je montre avant 1960.

Commençons par la qualité des données elles-mêmes. Jusqu'à la Seconde Guerre mondiale, les revenus étaient déclarés au niveau fédéral aux États-Unis. Par conséquent, les revenus étaient sous-déclarés dans les déclarations fiscales. Cependant, ce qui est moins connu, c'est que la sous-déclaration était beaucoup plus importante dans les classes de revenus inférieures et j'ai remarqué qu'il y avait eu des tonnes d'articles dans les 5 meilleures revues au cours de la période 1940-1970 qui utilisaient les systèmes d'impôt sur le revenu de l'État pour créer des estimations au niveau de l'État. Nous avons donc vérifié si ces articles faisaient état de revenus similaires à ceux de l'IRS.

Ils ne l'ont pas fait (voir les deux graphiques du bas). Ils ont déclaré plus de revenus et proportionnellement plus dans les classes à faibles revenus.

La raison en est que l'IRS contrôle davantage les hauts revenus que les bas revenus. Les rapports sont donc de meilleure qualité au sommet de l'échelle. Nous avons utilisé les données de deux États (le Wisconsin et le Delaware) qui disposaient de systèmes de contrôle très fermes sur l'ensemble de l'échelle des revenus. Et nous avons constaté que les niveaux d'inégalité étaient parfois inférieurs de plus de 5 points (pour les 1 % les plus aisés) à ceux de Piketty et Saez.
Mais comme nous ne sommes pas paresseux, nous nous sommes demandé si le Delaware et le Wisconsin n'étaient pas des bizarreries. Et si nous utilisions TOUS les États que nous pouvons trouver ? Encore une fois... même... schéma. Les données de l'IRS surestiment les inégalités.
Globalement, en moyenne, les données de l'IRS sont supérieures de 1,18 aux données correctes et ce chiffre est faible parce que nous ne remettons même pas en question leurs hypothèses. Le graphique ci-dessous montre l'ampleur de la surestimation par l'IRS.
À aucun moment, que ce soit dans l'article de 2003 ou depuis, Zucman avec Piketty et Saez n'ont envisagé que leurs données puissent être faibles. Aucun effort n'a été fait pour documenter les limites des données dues aux incitations.
À aucun moment -- dans le document de 2003 ou depuis -- Zucman, Piketty et Saez n'ont considéré que ses données pouvaient être insuffisantes. Aucun effort n'a été fait pour documenter les limites des données dues aux incitations.
Premièrement : Il est nécessaire d'ajuster les données manquantes car souvent moins de X% (X=fractile de choix, 10,5,1 etc.) des unités fiscales ont rempli une déclaration d'impôts. Les auteurs procèdent à un ajustement basé sur le marché du travail en 1942, en faisant valoir qu'il existe un échantillon de l'IRS qui leur permet de le faire.
Deux choses : 1942 est une année de guerre et l'ajustement sera faussé par la guerre. Deuxièmement, dans la même source qu'ils utilisent, il est fait mention d'un autre ensemble de données plus important, de meilleure qualité et portant sur l'année fiscale 1941. Il y a beaucoup moins de distorsions et c'est mieux.
Le simple fait de passer à 1941 change beaucoup de choses. Suffisamment pour enlever un point à la part des 10 % de revenus les plus élevés avant 1940.
Deuxièmement : avant 1943, l'IRS communique les données en termes de revenu net. Il y a donc un besoin évident d'ajuster le revenu brut. PS a simplement fait des hypothèses arbitraires qu'il a qualifiées de raisonnables et qu'il n'a pas détaillées (que vous ne pouvez trouver que dans leur fichier excel... en français (que je parle)).
Cependant, les hypothèses sont beaucoup trop libérales. Même si l'on comptabilise TOUTES les déductions de l'IRS et qu'on les compare aux déductions implicites (sans hypothèses sur la répartition entre les différentes catégories de revenus), le revenu brut implicite de la FP est presque toujours supérieur au revenu brut total de l'IRS.
De plus, dans les mêmes sources qu'ils utilisent, l'IRS fournit suffisamment de données pour créer des ajustements afin de convertir le net en brut au niveau de la classe de revenu. Cela permet d'enlever quelques points supplémentaires
Troisièmement, Piketty et Saez poursuivent en dénigrant le travail de Simon Kuznets sur le dénominateur des revenus pour estimer l'inégalité, mais il oublie de remarquer qu'il consacre beaucoup de temps, dans son livre, à expliquer comment les employés de l'État et des collectivités locales n'étaient pas obligés de déclarer leurs impôts avant 1939.
C'est important puisqu'ils passent d'environ 2 % de l'emploi à 5 % de l'emploi et que leur masse salariale semble augmenter encore plus rapidement. Cela réduit d'environ 1 à 2 points la part de revenu des 10 % les plus riches. Cela est dû au fait que je n'ai pas lu correctement les sources historiques.
Quatrièmement, ils doivent créer un dénominateur de revenu pour diviser les revenus les plus élevés. Pour ce faire, ils supposent qu'il s'agit de 80 % du revenu personnel (PNIA) moins les transferts. Cependant, ils commettent quatre grosses erreurs.
4a) Ils n'ont pas remarqué que Hawaï et l'Alaska sont inclus dans les données de l'IRS mais pas dans le PNIA. Ainsi, le numérateur et le dénominateur ont une couverture différente. Il s'agit d'une petite erreur, mais d'un manque de rigueur.
4b) Ils justifient la création de leurs dénominateurs au lieu de les relier à ceux de Simon Kuznets. Pour ce faire, ils ridiculisent Kuznets en soulignant que sa méthode signifie qu'en 1948, les non-déclarants avaient des revenus plus élevés que les déclarants. C'est invraisemblable, disent-ils.
Ils affirment que la méthode de Kuznets n'a été utilisée que pour les années 4b-cont), mais que cela n'est vrai que pour 1948. Pour toutes les autres années, Kuznets n'a pas ce problème.
4c) Ils disent qu'ils utilisent 80 % du revenu personnel moins les transferts parce que cela correspond à peu près aux chiffres de l'après-guerre. Ce n'est pas le cas ! C'est loin d'être le cas.
4c-cont) En fait, il est presque toujours supérieur à 80 % - et cela provient de leurs propres fiches techniques ! La différence entre 80 % et 82,7 % peut sembler minime. Toutefois, elle représente 1,35 point de pourcentage supplémentaire pour les 10 % les plus performants.
4d) Ils affirment ensuite qu'ils utilisent l'hypothèse selon laquelle les non-remplaçants disposaient de 20 % du revenu des remplaçants pour créer le dénominateur après 1943. Mais ce n'est pas ce qu'ils font. Ils utilisent des proportions différentes qu'ils n'expliquent jamais et qui ne correspondent pas à leurs descriptions en annexe.
Phil Magness et moi avons donc simplement décidé qu'il valait mieux construire notre dénominateur de revenu à partir de zéro en utilisant les lignes directrices du BEA pour créer un dénominateur de revenu qui soit, par définition, cohérent avec les chiffres du revenu brut de l'IRS. Nous l'avons fait ligne par ligne et année par année (un an de travail)
Ce dénominateur nous place entre les estimations de Kuznets et les estimations du PS. Mais il retranche entre 3 et 6 points de pourcentage de la part des 10 % de revenus les plus élevés et entre 0,5 et 2 points de la part des 1 % de revenus les plus élevés.
Vous aboutissez également à une tendance radicalement différente où l'essentiel du nivellement de l'inégalité se produit pendant la dépression et non pendant la seconde guerre mondiale.
Mais nous savons que les erreurs méthodologiques qui ont conduit PS à surestimer les inégalités doivent être ajoutées aux problèmes de qualité des données de l'IRS. La ligne rouge est donc probablement encore plus basse que ce que nous montrons.
D'accord, vous pouvez vous moquer de moi maintenant et dire "on s'en fout, Vincent". Moi, je m'en soucie ! Je tiens à ce que les données soient traitées avec respect et à ce que les sources historiques ne soient pas malmenées.
Je pense que mes corrections suggèrent que l'inégalité a été traitée davantage en raison de la dépression qu'en raison des changements de politique fiscale dans les années 1940. Cela correspond à l'histoire de Walter Scheidel selon laquelle les catastrophes tendent à être les facteurs de nivellement les plus efficaces.
Mais même si vous n'êtes pas d'accord, vous ne pouvez pas négliger les données. Je passe des heures et des jours à documenter TOUS mes choix de données dans tous mes articles et je partage mes données pour que les gens puissent me critiquer.
Mais ce n'est pas tout, il faut faire son autocritique et se demander si l'on travaille de manière à voir ce que l'on veut voir. Est-ce que j'obtiens les résultats que je veux à cause de la façon dont je le fais ou est-ce que ce sont les vrais résultats ?
N'oubliez pas que je ne suis pas le seul à le souligner. Gerald Auten et David Splinter ont mis en évidence d'autres problèmes liés au traitement des données, au choix des unités pour les ménages/unités fiscales et aux définitions des revenus. 
Mechling et al. ont montré que leurs choix de données permettent aux réformes fiscales de 1986 d'influencer les résultats uniquement pour des raisons de comptabilité fiscale. Une fois la correction effectuée, on constate que le creux de l'inégalité est plus élevé (de sorte que l'augmentation après 1980 est plus faible) 
En fait, je suis tellement sceptique à l'égard de leur travail que s'ils me disaient qu'ils sont d'accord avec moi, je referais probablement tout mon travail une fois de plus pour être sûr de ne pas avoir oublié quelque chose d'important.

En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.

Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !