Sans cet article, les autres ne suivent pas. Il s'agit de l'élément de base essentiel et le fait d'y apporter des modifications modifie les autres articles (sur la fiscalité optimale, sur la progressivité, sur l'inégalité des richesses).
Commençons par la qualité des données elles-mêmes. Jusqu'à la Seconde Guerre mondiale, les revenus étaient déclarés au niveau fédéral aux États-Unis. Par conséquent, les revenus étaient sous-déclarés dans les déclarations fiscales. Cependant, ce qui est moins connu, c'est que la sous-déclaration était beaucoup plus importante dans les classes de revenus inférieures et j'ai remarqué qu'il y avait eu des tonnes d'articles dans les 5 meilleures revues au cours de la période 1940-1970 qui utilisaient les systèmes d'impôt sur le revenu de l'État pour créer des estimations au niveau de l'État. Nous avons donc vérifié si ces articles faisaient état de revenus similaires à ceux de l'IRS.
Ils ne l'ont pas fait (voir les deux graphiques du bas). Ils ont déclaré plus de revenus et proportionnellement plus dans les classes à faibles revenus.
La raison en est que l'IRS contrôle davantage les hauts revenus que les bas revenus. Les rapports sont donc de meilleure qualité au sommet de l'échelle. Nous avons utilisé les données de deux États (le Wisconsin et le Delaware) qui disposaient de systèmes de contrôle très fermes sur l'ensemble de l'échelle des revenus. Et nous avons constaté que les niveaux d'inégalité étaient parfois inférieurs de plus de 5 points (pour les 1 % les plus aisés) à ceux de Piketty et Saez.
Mais comme nous ne sommes pas paresseux, nous nous sommes demandé si le Delaware et le Wisconsin n'étaient pas des bizarreries. Et si nous utilisions TOUS les États que nous pouvons trouver ? Encore une fois... même... schéma. Les données de l'IRS surestiment les inégalités.
Globalement, en moyenne, les données de l'IRS sont supérieures de 1,18 aux données correctes et ce chiffre est faible parce que nous ne remettons même pas en question leurs hypothèses. Le graphique ci-dessous montre l'ampleur de la surestimation par l'IRS.
À aucun moment, que ce soit dans l'article de 2003 ou depuis, Zucman avec Piketty et Saez n'ont envisagé que leurs données puissent être faibles. Aucun effort n'a été fait pour documenter les limites des données dues aux incitations.
À aucun moment -- dans le document de 2003 ou depuis -- Zucman, Piketty et Saez n'ont considéré que ses données pouvaient être insuffisantes. Aucun effort n'a été fait pour documenter les limites des données dues aux incitations.
Premièrement : Il est nécessaire d'ajuster les données manquantes car souvent moins de X% (X=fractile de choix, 10,5,1 etc.) des unités fiscales ont rempli une déclaration d'impôts. Les auteurs procèdent à un ajustement basé sur le marché du travail en 1942, en faisant valoir qu'il existe un échantillon de l'IRS qui leur permet de le faire.
Deux choses : 1942 est une année de guerre et l'ajustement sera faussé par la guerre. Deuxièmement, dans la même source qu'ils utilisent, il est fait mention d'un autre ensemble de données plus important, de meilleure qualité et portant sur l'année fiscale 1941. Il y a beaucoup moins de distorsions et c'est mieux.
Le simple fait de passer à 1941 change beaucoup de choses. Suffisamment pour enlever un point à la part des 10 % de revenus les plus élevés avant 1940.
Deuxièmement : avant 1943, l'IRS communique les données en termes de revenu net. Il y a donc un besoin évident d'ajuster le revenu brut. PS a simplement fait des hypothèses arbitraires qu'il a qualifiées de raisonnables et qu'il n'a pas détaillées (que vous ne pouvez trouver que dans leur fichier excel... en français (que je parle)).
Cependant, les hypothèses sont beaucoup trop libérales. Même si l'on comptabilise TOUTES les déductions de l'IRS et qu'on les compare aux déductions implicites (sans hypothèses sur la répartition entre les différentes catégories de revenus), le revenu brut implicite de la FP est presque toujours supérieur au revenu brut total de l'IRS.
De plus, dans les mêmes sources qu'ils utilisent, l'IRS fournit suffisamment de données pour créer des ajustements afin de convertir le net en brut au niveau de la classe de revenu. Cela permet d'enlever quelques points supplémentaires
Troisièmement, Piketty et Saez poursuivent en dénigrant le travail de Simon Kuznets sur le dénominateur des revenus pour estimer l'inégalité, mais il oublie de remarquer qu'il consacre beaucoup de temps, dans son livre, à expliquer comment les employés de l'État et des collectivités locales n'étaient pas obligés de déclarer leurs impôts avant 1939.
C'est important puisqu'ils passent d'environ 2 % de l'emploi à 5 % de l'emploi et que leur masse salariale semble augmenter encore plus rapidement. Cela réduit d'environ 1 à 2 points la part de revenu des 10 % les plus riches. Cela est dû au fait que je n'ai pas lu correctement les sources historiques.
Quatrièmement, ils doivent créer un dénominateur de revenu pour diviser les revenus les plus élevés. Pour ce faire, ils supposent qu'il s'agit de 80 % du revenu personnel (PNIA) moins les transferts. Cependant, ils commettent quatre grosses erreurs.
4a) Ils n'ont pas remarqué que Hawaï et l'Alaska sont inclus dans les données de l'IRS mais pas dans le PNIA. Ainsi, le numérateur et le dénominateur ont une couverture différente. Il s'agit d'une petite erreur, mais d'un manque de rigueur.
4b) Ils justifient la création de leurs dénominateurs au lieu de les relier à ceux de Simon Kuznets. Pour ce faire, ils ridiculisent Kuznets en soulignant que sa méthode signifie qu'en 1948, les non-déclarants avaient des revenus plus élevés que les déclarants. C'est invraisemblable, disent-ils.
Ils affirment que la méthode de Kuznets n'a été utilisée que pour les années 4b-cont), mais que cela n'est vrai que pour 1948. Pour toutes les autres années, Kuznets n'a pas ce problème.
4c) Ils disent qu'ils utilisent 80 % du revenu personnel moins les transferts parce que cela correspond à peu près aux chiffres de l'après-guerre. Ce n'est pas le cas ! C'est loin d'être le cas.
4c-cont) En fait, il est presque toujours supérieur à 80 % - et cela provient de leurs propres fiches techniques ! La différence entre 80 % et 82,7 % peut sembler minime. Toutefois, elle représente 1,35 point de pourcentage supplémentaire pour les 10 % les plus performants.
4d) Ils affirment ensuite qu'ils utilisent l'hypothèse selon laquelle les non-remplaçants disposaient de 20 % du revenu des remplaçants pour créer le dénominateur après 1943. Mais ce n'est pas ce qu'ils font. Ils utilisent des proportions différentes qu'ils n'expliquent jamais et qui ne correspondent pas à leurs descriptions en annexe.
Phil Magness et moi avons donc simplement décidé qu'il valait mieux construire notre dénominateur de revenu à partir de zéro en utilisant les lignes directrices du BEA pour créer un dénominateur de revenu qui soit, par définition, cohérent avec les chiffres du revenu brut de l'IRS. Nous l'avons fait ligne par ligne et année par année (un an de travail)
Ce dénominateur nous place entre les estimations de Kuznets et les estimations du PS. Mais il retranche entre 3 et 6 points de pourcentage de la part des 10 % de revenus les plus élevés et entre 0,5 et 2 points de la part des 1 % de revenus les plus élevés.
Vous aboutissez également à une tendance radicalement différente où l'essentiel du nivellement de l'inégalité se produit pendant la dépression et non pendant la seconde guerre mondiale.
Mais nous savons que les erreurs méthodologiques qui ont conduit PS à surestimer les inégalités doivent être ajoutées aux problèmes de qualité des données de l'IRS. La ligne rouge est donc probablement encore plus basse que ce que nous montrons.
D'accord, vous pouvez vous moquer de moi maintenant et dire "on s'en fout, Vincent". Moi, je m'en soucie ! Je tiens à ce que les données soient traitées avec respect et à ce que les sources historiques ne soient pas malmenées.
Je pense que mes corrections suggèrent que l'inégalité a été traitée davantage en raison de la dépression qu'en raison des changements de politique fiscale dans les années 1940. Cela correspond à l'histoire de Walter Scheidel selon laquelle les catastrophes tendent à être les facteurs de nivellement les plus efficaces.
Mais même si vous n'êtes pas d'accord, vous ne pouvez pas négliger les données. Je passe des heures et des jours à documenter TOUS mes choix de données dans tous mes articles et je partage mes données pour que les gens puissent me critiquer.
Mais ce n'est pas tout, il faut faire son autocritique et se demander si l'on travaille de manière à voir ce que l'on veut voir. Est-ce que j'obtiens les résultats que je veux à cause de la façon dont je le fais ou est-ce que ce sont les vrais résultats ?
N'oubliez pas que je ne suis pas le seul à le souligner.
Gerald Auten et David Splinter ont mis en évidence d'autres problèmes liés au traitement des données, au choix des unités pour les ménages/unités fiscales et aux définitions des revenus.
Mechling et al. ont montré que leurs choix de données permettent aux réformes fiscales de 1986 d'influencer les résultats uniquement pour des raisons de comptabilité fiscale. Une fois la correction effectuée, on constate que le creux de l'inégalité est plus élevé (de sorte que l'augmentation après 1980 est plus faible)
En fait, je suis tellement sceptique à l'égard de leur travail que s'ils me disaient qu'ils sont d'accord avec moi, je referais probablement tout mon travail une fois de plus pour être sûr de ne pas avoir oublié quelque chose d'important.
En raison de débordements, nous avons fait le choix de suspendre les commentaires des articles d'Atlantico.fr.
Mais n'hésitez pas à partager cet article avec vos proches par mail, messagerie, SMS ou sur les réseaux sociaux afin de continuer le débat !