Le Grand Débat National : un potentiel de données à analyser de différentes manières
La crise des gilets jaunes a montré l’envie croissante des citoyens d’être davantage intégrés aux décisions politiques. Pour répondre à ce besoin, le Gouvernement a lancé en janvier dernier le Grand Débat National. En présentiel ou en ligne, tous les citoyens ont été invités à s’exprimer sur 4 thématiques : fiscalité et dépenses publiques, transition écologique, organisation de l’État et des services publics, démocratie et citoyenneté.
Lors de la conception méthodologique de cette initiative, j’ai fortement plaidé pour que l’ensemble des contributions recueillies sur la plateforme granddebat.fr soient mises à disposition en open data. Cela signifie que les données publiées sur la plateforme doivent être téléchargeables et réutilisables afin de réaliser des analyses à partir de celles-ci. Mon combat n’a pas été vain puisque les garants ont décidé d’ouvrir les données du Grand Débat National. Très rapidement, des milliers de contributions ont été publiées sur la plateforme et mise en open data ici : https://granddebat.fr/pages/donnees-ouvertes
Le Grand débat national en quelques chiffres (chiffres au 19/03/2019)
+ 1,9 millions
de contributions
Près de 480 000
inscrits sur la plateforme
Près de 10 500
réunions locales organisées
Près de 300
réunions organisées à l’international
Un hackathon sur les données du Grand Débat National le 23 mars à l’Assemblée national
C’est un évènement que j’ai fortement poussé auprès de la Présidence de l’Assemblée nationale et qui a finalement trouvé écho et se déroulera le samedi 23 mars de 9h à 19h au sein du prestigieux Hôtel de Lassay, à l’Assemblée nationale.
La richesse historique des contributions au Grand Débat National invite à s’emparer de ces données afin de participer aux analyses diverses que nous pouvons révéler de cet exercice démocratique unique. Cette synthèse collective permettra d’enrichir le débat, en étant clairs sur les biais et les partis pris éventuels des méthodes utilisées.
Cette journée est ouverte à tous ceux qui ont déjà développé un projet d’analyse ou qui souhaitent contribuer activement à l’analyse de ces données.
A l’issue de la journée, un jury sélectionnera des projets qui feront l’objet d’une présentation au Président de l’Assemblée nationale, aux député.e.s et à la presse, le jeudi 28 mars matin.
J’ai hâte de découvrir les résultats de cette journée.
Des initiatives parallèles au Grand Débat National
Avec des données, il est possible de concevoir toute sortes de projets. Ci-dessous une liste non-exhaustive de ce que j’ai trouvé particulièrement pertinent.
- GrandeAnnotation.fr : une plateforme d’annotation collaborative citoyenne des contributions au grand débat. Son but : chacun doit lire des réponses formulées par d’autres aux questions du granddebat.fr et les taguer selon des mots clés. Déjà 735 765 actions réalisées par 939 humains.
- Entendre la France est un «chatbot» -algorithme qui pose automatiquement des questions à un internaute- qui pose les questions officielles du Grand débat national via l’application Facebook Messenger. Le chatbot a récolté plus de 250 000 propositions dans le cadre du Grand Débat National, dont 80% par des jeunes de moins de 35 ans.
- L’Observatoire des débats vise à collecter des données sur les réunions ou plateformes numériques, déclarées ou non, du « Grand Débat National ». Les observations portent sur l’organisation, le déroulement, les thématiques discutées et les propositions formulées lors de réunions de toutes natures, sur des plateformes numériques et sur les réseaux sociaux, durant le temps du « grand débat national » jusqu’aux conclusions qu’en tirera le gouvernement. Un protocole d’observation a été élaboré sous la direction de Martial Foucault, directeur du Cevipof (CNRS-Sciences Po), qui prévoit le suivi d’environ 60 débats par semaine, sélectionnés par tirage au sort afin de représenter au mieux l’ensemble du territoire français.
Les chiffres clés au 20 février 2019, 3 semaines après l’appel à constitution de l’Observatoire des débats :- 172 observatrices et observateurs inscrits sur la liste.
- 68 ont réalisé une ou des observations de réunions publiques.
- 127 débats ont été observés au 20 février, sur 4767 débats tenus, soit un taux d’observation de 2,6% des débats déclarés sur le site du « Grand Débat National ».
- Dans la grosse majorité des débats observés, un questionnaire sociopolitique a été passé auprès des participants : environ 3000 questionnaires ont été récoltés (dont le traitement n’a pas démarré, faute de temps et de ressources humaines pour la saisie).
- Répartition géographique des débats observés :
- 20% en Île-de-France
- 15% en Occitanie
- 13% dans les Hauts-de-France
Des premières réutilisations qui enrichissent le débat
La mise en open data des contributions au Grand Débat National a d’ores et déjà permis de nombreuses réutilisations lancées par des citoyens et des pouvoirs publics : data visualisations, plateforme d’annotation, agrégation de citations… Ces réutilisations permettront d’enrichir l’analyse du Grand Débat et d’inclure des citoyens au processus de synthèse. Si vous êtes du côté ré-utilisateur, n’hésitez pas à enrichir cette liste.
Réutilisation #1 :
A la question “Que pensez-vous de l’organisation de l’Etat et des administrations en France ? De quelle manière cette organisation devrait-elle évoluer ?” : les 100 premiers tags les plus discriminants parmi 28.363 réponses en texte libre – via @SemdeeSAS à venir le clustering…
Réutilisation #2 :
Lobbies, députés, citoyens… Qui sont les acteurs du grand débat ? Découvrez deux data visualisations réalisées avec les données ud Grand débat national au 27 janvier 2019.
Réutilisation #3 :
Nombre de contributeurs sur le site du Grand Débat National agrégés par département ainsi que rapporté à la population départementale (population légale 2016 de l’INSEE).
Les calculs ont été faits sur les données publiées au 6/2/2019 en se basant sur le code postal déclaré lors de l’inscription.
La visualisation ci-dessous représente les contributeurs rapportées à la population.
Réutilisation #4 :
Première analyse simple des questions fermées : des notebooks commençant un travail d’analyse statistique rudimentaire sur les questions fermées du grand débat.