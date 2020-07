Atlantico.fr : Après avoir été menacé d'interdiction par Donald Trump, l'application Tik Tok a promis de dévoiler son algorithme tant convoité. En quoi cette diffusion est-elle l'illustration d'un enjeu politique entre Tik tok (entreprise chinoise) et les États-Unis ?

Didier Hardoin : TikTok, l'application de partage de vidéos qui concurrence directement les autres réseaux sociaux (Instagram, Facebook, etc.), est " l'outsider " du jeu, car cette dernière appartient à la compagnie ByteDance d'origine chinoise. On se heurte alors à un tableau où les acteurs des réseaux socisaux historiques (américains) est défié par un acteur chinois, qui a eu une belle croissance en seulement quatre ans. Tout comme Huawei, TikTok a pu echapper au confinement de la Chine pour prendre la guerre contre les géants américains. On peut déjà commencer à mettre le contexte à partir de la nouvelle qui apparait sur le Wall Street Journal qui dirait que Facebook aurait fait des offres très généreuses à des influenceurs sur TikTok afin de les faire abandonner au profit d'Instagram et sa nouvelle fonctionalité Reels. En réponse à cette action, Business Insider nous racconte comment TikTok lance une campagne à hauteur de 300 millions de dollars (pour l'Europe) afin de permettre aux créateurs de videos de pouvoir gagner leur vie à travers la plateforme...

La nouvelle qui promet de dévoiler son algorithme, qui inciterait aux autres acteurs de faire pareil pour niveler le terrain de jeu, semblerait être une technique stratégique pour coopter des nouveaux utilisateurs, créateurs de contenus et en faire migrer d'autres définitivement dans cette bataille des réseaux sociaux. Pourquoi soudainement un enjeu politique? Mise à part la défiance contre les tech giants aux USA, on est face à une plateforme dont le gouverment américain craint que les données utilisateurs vont directement en Chine pour un analyse et exploitation. Comme tout réseau social, il contient des données dont les utilisateurs donnent en grande partie de façon volontaire et qui pourrait éventuellement servir à des fins de renseignement.

Cette déclaration viserait aussi à donner une transparence sur le traitement des données et "apaiser" certaines critiques.

David Fayon : Déjà, TikTok est le réseau social qui a la plus forte progression. Constituant un phénomène de société chez les adolescents, il permet de réaliser de courtes vidéos avec des effets spéciaux, des filtres, un fond musical, etc. L’outil addictif favorise la créativité et compte près d’un milliard d’utilisateurs actifs dans le monde. Il est apparu en Chine en étant baptisé Douyin en septembre 2016 et a été adapté pour les marchés occidentaux (avec des serveurs et de fait des contenus différents) l’année suivante sous ce nom de TikTok en étant disponible sur l’App Store et Google Play. Massivement téléchargé, son développement a été spectaculaire avec également le rachat de Musical.ly.

S’agissant du président américain, il aime les phrases chocs et faire le buzz. C’est dans son ADN pour séduire et fidéliser son électorat et il en joue. Dans le match pour la suprématie mondiale que se livrent les États-Unis et son challengeur la Chine avec ses BATHX (Baidu Alibaba Tencent Huawei Xiaomi) mais pas que, chacun essaye d’imposer ses outils et de séduire au-delà de ses frontières pour conquérir le monde qui est devenu numérique. Le fait nouveau est que la Chine numérique s’est éveillée. Elle séduit avec ses outils au-delà de son territoire en ne faisant plus que copier mais en innovant. Rappelons que le développement massif d’Internet s’est fait en Chine avec le mobile (avec des App comme Alipay et WeChat) sans passer par la case ordinateur réservée aux pionniers.

Il ne s’agit pas en l’espèce de dévoiler l’algorithme dans son intégralité mais les principes avec la politique de modération associée, de recommandation de contenus créés par les utilisateurs afin que les régulateurs disposent de ces éléments.

TikTok, qui est une application de la plateforme chinoise ByteDance, utilise la masse colossale de vidéos créées par les utilisateurs combinée avec des techniques de l’intelligence artificielle (machine learning) sur l’ensemble du cycle de vie des vidéos : création, modération, interaction avec les utilisateurs.

C’est aussi pour le Groupe ByteDance un moyen de prendre de l’avance et d’afficher une transparence, du moins en apparence et de prendre l’ascendant en matière de communication en faisant pression sur les concurrents au premier rang desquels Facebook pour qu’ils fassent de même. C’est – il ne faut pas être naïf – un jeu de poker menteur. Et aussi un moyen de faire taire les accusations ou du moins les méfiances dont est victime TikTok (inquiétudes quant à la gestion des données personnelles et espionnage de la part de la Chine).

Quelques heures avant l'audition des PDG de Facebook, Google, Amazon et Apple, le PDG de TikTok, Kevin Mayer, a proclamé que toutes les plateformes devraient «divulguer leurs algorithmes, leurs politiques de modération et leurs flux de données aux régulateurs». Selon vous, Mark Zuckerbger, Sundar Pichai, Tim Cook et Jeff Bezos vont-ils suivre cette démarche ? en être obligés ?

Didier Hardoin : Est-ce qu'ils vont être obligés: non.

Est-ce qu'ils vont suivre: probablement, probablement pas.

L'algorithme étant la pierre centrale de ces plateformes, la manière dont ils marchent, le coeur du système. Le dévoiler serait quasiment comme dévoiler la recette du Coca-Cola au monde, afin que d'autres puissent la comprendre ou la réproduire. Dans cet exemple on connait tous differentes marques qui font ce soda de couleur quasiment noir, mais certains se penchent pour une marque plus qu'une autre. Un example flagrant comparable serait l'application TELEGRAM, qui met son code ouvert et disponible à tout le monde.

Facebook fait des efforts pour que les personnes comprennent comment marche leur algorithme: pourquoi je vois ceci dans mon feed, qu'est-ce qui est important pour moi, etc. Toutefois il ne nous donne pas la recette magique des rouages du système. Plusieurs guides existent pour une optimisation, comme pour les moteurs de recherche. Une sorte de transparence au traitement de données.

Les algorithmes des plateformes évoluent continuellement, la question serait de savoir si TikTok va continuer à dévoiler les évolutions où si nous devons en déduire le fonctionnement à partir de ces denières, et comment vont faire les concurrents face à cette dernière stratégie de transparence...

David Fayon : Il est vrai que les algorithmes sont vus comme opaques, comme étant de véritables boîtes noires. Et que le citoyen, quand un droit lui est refusé, aimerait connaître les raisons.

La tendance globale dans la société et qui vaut aussi pour les GAFA et le politique est la transparence. Sans elle, la suspicion est de mise d’autant que l’utilisation des données personnelles constitue un sujet sensible avec les possibles réutilisations commerciales ou de cybersurveillance de la population.

Rappelons que Kevin Mayer qui dirige TikTok est américain et ancien de Disney. Il est rattaché à Zhang Yiming, fondateur et PDG de ByteDance, la holding chinoise basée à Pékin dont dépend TikTok. Il a en charge le développement international du groupe (commercial, relations publiques, juridique, etc.) notamment aux États-Unis et dans les pays occidentaux. Le fait que ce soit un américain est de nature à rassurer les utilisateurs vis-à-vis de cet acteur chinois et l’exploitation des données personnelles qui pourrait être effectuée par les autorités chinoises.

Il est à parier que les patrons des GAFAM feront de même pour certaines applications mais ils resteront dans les grandes lignes. Et comprendre les algorithmes qui utilisent des nombreux paramètres n’est pas chose aisée. La communication sera grandement simplifiée. Déjà pour l’algorithme de Facebook et d’Instagram, l’EdgeRank, les principes sont communiqués : celui-ci décide quels vont être les posts affichés dans votre Timeline (selon l’affinité qui existe entre un utilisateur et un créateur de contenu avec le degré d’interaction, la fraîcheur du post, le caractère attractif du contenu, etc.) et qui explique que l’on n’a pas l’ensemble des publications de ses contacts directement visibles. En outre, un algorithme est amené à évoluer et être enrichi dans le temps. Google pour son moteur de recherche le fait en permanence.

Par ailleurs, il convient de donner les principes de l’algorithme sans livrer les données personnelles des utilisateurs (même si pour chaque réseau social, la demande par l’utilisateur d’un historique de ses actions réalisées est possible et répond au principe de « portabilité des données »).

Après la publication de l'algorithme par Tik Tok, pensez-vous que les utilisateurs vont adapter leur utilisation de l'application ?

Didier Hardoin : Il est certain que les créateurs de médias (influenceurs, publicistes, créateurs de contenu) vont certainement étudier l'algorithme afin d'adapter leur stratégie. Les autres utilisateurs continueront à utiliser la plateforme de la même manière qu'avant.

David Fayon : Déjà pour TikTok, certains utilisateurs ont un compte privé pour réaliser des vidéos qu’ils ne souhaitent pas publier ou qu’ils veulent partager uniquement avec quelques amis.

Ensuite comme pour l’ensemble des réseaux sociaux, il existe un phénomène de panurge. Chaque internaute utilise les outils que sa communauté adopte. Cela est le cas pour Snapchat également prisé des adolescents alors que Facebook est délaissé par les jeunes même si au sein du numéro 1 des réseaux sociaux, Instagram et WhatsApp progressent.

On l’a vu aussi avec les migrations de MySpace vers Facebook et depuis plusieurs mois côté réseaux sociaux professionnels de Viadeo vers LinkedIn.

Outre les utilisateurs, ce peut être aussi les annonceurs qui changent leur fusil d’épaule selon la politique commerciale du réseau social, son éthique ou les déclarations de ses dirigeants. Nous avons plusieurs décisions qui se superposent et qui font qu’un outil va être délaissé ou utilisé différemment avec pour les utilisateurs souvent des modifications des paramètres de confidentialité ou une plus grande précaution quant à la diffusion de données sensibles qui peuvent être réutilisées ultérieurement.

D’autres paramètres rentrent en compte comme la censure du contenu (la répression des Ouïghours, les manifestations de Hong Kong) et des phénomènes de société (consommation énergétique, politique RSE de l’entreprise) peuvent aussi avoir un effet sur le choix ou non du réseau. Et face à cette censure réelle même si avec la production colossale de contenu, il est illusoire de vouloir tout modérer, TikTok a employé un groupe de lobbyistes américains. C’est un enjeu important pour défendre son produit d’autant que le groupe ByteDance a écopé d’une amende de 5,7 millions de dollars infligée par la Federal Trade Commission (FTC) reconnu coupable d’une collecte illégale de données personnelles d’enfants de moins de 13 ans alors que l’autorisation parentale est requise. Et que l’âge minimum est de 13 ans et que TikTok déclare supprimer les comptes des enfants de moins de 13 ans. L’âge requis sur les réseaux sociaux est souvent de 13 parfois de 15 ans, âge défini pour la « majorité numérique » et voté par les parlementaires en France.

L’enjeu pour TikTok est de développer un produit mainstream indépendant des critères de cyber surveillance chinois. Les données sont ainsi stockées aux États-Unis dans l’État de Virginie et à Singapour.

Certains utilisateurs se sont demandent si TikTok est dans la capacité de révéler des détails sur ses algorithmes sans exposer les données personnelles de ses utilisateurs. Selon le journaliste Nicolas Kayser-Bril, les algorithmes d'apprentissage automatique utilisés par les plateformes dépendent non seulement du code qui les exploite, mais aussi des données de formation qui peuvent influencer leur fonctionnement. «Dans le cas des algorithmes de TikTok, les données de formation contiennent probablement des informations très personnelles des utilisateurs, qui ne devraient pas être révélées en tant que telles, même aux chercheurs», a-t-il déclaré. Quels sont les risques que peuvent rencontrer les utilisateurs ? Nos données personnelles sont-elles en péril ?

Didier Hardoin : On est face à une plateforme sociale et surtout face à ce que l'on peut citer comme "l'or noir du futur": c'est à dire nos données. Qu'est-ce qu'on devrait comprendre par-là; nous donnons de nôtre plein gré certaines informations à ces plateformes, à partir de ce moment nous consentons déjà l'usage qui sera fait pour ces dernières.

Premièrement nous faisons don déjà des données (âge, sexe, pays) qui permettent un certain ciblage publicitaire plus ou moins fin, dont toutes les plateformes s'en servent pour nous proposer des contenus adaptés, bien entendu ces données sont la base du marché des réseaux sociaux. On va vendre nos données pour effectuer un ciblage publicitaire, et donc permettre d'acheter des campagnes de publicité gagnantes vis-à-vis des acheteurs de cette dernière.

Dans ce qui est dit (à ce jour) par TikTok, est de révéler le fonctionnement de l'algorithme c'est à dire de savoir comment ce dernier s'adapte pour proposer des contenus et construire à la fois l'expérience utilisateur, ainsi que l'expérience créateur. Tout algorithme d'apprentissage prend des données quelque part, mais pour comprendre son fonctionnement on n'a pas besoin de ces données. A mon sens, TikTok ne fera que lever le voile sur les rouages qui font marcher sa machine, "sa recette de soda".

Il faut toutefois se rappeler d'une chose, tout utilisateur encourt un risque, ne parlons pas en termes de securité de son compte (qui est aussi important), mais plûtot de ce qu'il met en ligne dans ces réseaux. TikTok a été fortement critiqué par les Etats-Unis car il est accusé de donner des données utilisateurs au gouvernement chinois. Mais comme partout dans ces plateformes, nos données sont hébérgées dans une compagnie qui est hors de nos frontières, que ça soit TikTok ou Facebook, nos données personnelles sont stockées dans un autre pays qui n'a parfois autant de règles que chez nous. Je souligne alors l'attention qu'il faut donner à toute publication dans ces réseaux, et la portée de cette dernière (public, privé). Car internet à une mémoire et parfois si on cherche un peu, on peut trouver des choses "intéressantes" qu'on aurait tendance à oublier.

David Fayon : Oui Nicolas Kayser-Bril a raison : une des difficultés vient que les algorithmes utilisés se mêlent avec les techniques de machine learning qui exploitent les données des utilisateurs. Avec le mécanisme d’apprentissage qui nécessite de traiter des données personnelles, le fonctionnement même de l’algorithme va être impacté. Mais le machine learning demande de traiter des quantités colossales de données de façon à produire des mécanismes de déduction et de raisonnement. Le processus est long et a du mal dans certains domaines à égaler l’homme. Pour prendre un exemple, si vous montrez 3 ou 4 photos d’une girafe à un enfant de 3 ans, il pourra en reconnaître une dans une série de nouvelles photos que vous lui montrerez même si l’une d’elle a une pâte cassée. Il n’est pas sûr qu’avec les algorithmes d’apprentissage automatique il en soit de même. En outre à la base ces algorithmes ont été programmés par des humains et des règles précises avec d’éventuels biais.

Nos données personnelles ne sont pas en péril mais il convient d’être vigilant. On le voit avec l’évolution législative qui permet par exemple plus de contrôle aux Gouvernements. Nous avons toutefois un garde-fou en Europe, avec le RGPD et en France avec la CNIL, autorité administrative indépendante qui œuvre de concert. Les entreprises doivent s’y conformer sous peine de sanctions. Et les citoyens se mobiliser si une entrave forte à leur liberté est décidée par des représentants parfois déconnectés des techniques et des usages du numérique.

Il convient néanmoins d’être méfiant et de réfléchir quant à l’utilisation gratuite apparente d’un produit. Les données personnelles constituent le nouvel or transparent, le carburant de la société du XXIe siècle. Une utilisation comme outil d’intelligence économique – tant par la Chine que par les États-Unis – et d’influence (on l’a vu en juin 2013 avec les révélations d’Edward Snowden sur les écoutes sur Internet puis avec le scandale Cambridge Analytica en 2016 qui a affecté Facebook et a eu des conséquences en matière de manipulation politique).

Si le juriste américain Lawrence Lessig déclarait « Code is law », on peut dire également affirmer que « Data is power » ! Les deux, le code informatique et les données sont indissociables.