Huma-Num
La très grande infrastructure de recherche des humanités numériques
La TGIR Huma-Num est portée par l’unité d’appui et de recherche (UAR) 3598, ayant pour tutelles principales le CNRS et le Campus Condorcet, et pour tutelle secondaire l’université d’Aix-Marseille.
Elle structure, par l’intermédiaire de consortiums regroupant des acteurs des communautés scientifiques et d’un réseau de points de présence dans les maisons des sciences de l’Homme (MSH), l’accompagnement des communautés scientifiques SHS en matière d’infrastructure numérique pour les données de la recherche.
Elle met en œuvre une infrastructure numérique permettant aux communautés SHS de développer, de réaliser et de préserver sur le long terme les programmes de recherche – leurs données et outils- dans un contexte de science ouverte et de partage des données.
Lors de l'école d'automne de l'ILVV en 2020, Morgane Mignon, Ingénieure d'études en humanités numériques à la Maison des Sciences de l'Homme de Bretagne (MSHB) a présenté "Gérer ses données de recherche : outils, services et ressources":
Pour voir la présentation de Morgane Mignon
à l'école d'automne de l'ILVV 2020 (Chaîne de l'ILVV)
PROGEDO
PROduction et GEstion des DOnnées
PROGEDO est une Très Grande Infrastructure de Recherche (TGIR) chargée d’impulser et structurer une politique publique des données pour la recherche en sciences sociales. Elle intéresse particulièrement la recherche en droit, économie, géographie, gestion, histoire, sciences politiques et sociologie. Son objectif est le développement de la culture des données dans les communautés de recherche en sciences humaines et sociales en France. Ses missions constituantes sont les suivantes :
- le développement d’un dispositif d’archivage, de documentation et de mise à disposition des données de son périmètre, comprenant un dispositif d’accès sécurisé à distance pour les données confidentielles,
- la participation à la production de grandes enquêtes pluridisciplinaires d’intérêt national retenues sur la feuille de route des infrastructures européennes (ESFRI),
- l’animation d’une dynamique nationale autour des compétences de l’infrastructure.
Lors de l'école d'automne de l'ILVV en 2020, Louis David, Ingénieur de la Plateforme Universitaire de données (PUD) à la MSH de Bretagne a présenté "Accès aux enquêtes existantes et diffusion des données produites via le portail Quételet-Progedo "
Pour voir la présentation de Louis David
à l'école d'automne de l'ILVV 2020 (Chaîne de l'ILVV)
Portail Epidemiologie - France
Catalogue des bases de données individuelles en santé en France
Le portail Épidémiologie-France est un outil internet qui propose un catalogue en ligne des principales bases de données individuelles en santé de source française qui peuvent être utiles au développement de la recherche et de l’expertise en santé publique. Chaque base de données répertoriée dans le catalogue est décrite selon ses caractéristiques essentielles : objectifs, thématiques, populations couvertes, nature des informations recueillies, conditions d’accès, responsable… Les éléments composant les fiches descriptives des bases de données ont été spécialement conçues pour faciliter la compréhension des informations qui y figurent : elles sont suffisamment générales pour permettre la description de bases de données très diverses dans leurs objectifs comme dans les modes de recueil des données. Les critères permettent de faire des recherches notamment sur les groupes d'âges (65-79 ans et 80 ans et plus).
Le portail « Epidémiologie – France » est une des actions prioritaires préconisées par le Conseil Stratégique des Industries de Santé (CSIS) pour accélérer le développement de la recherche en épidémiologie et en santé publique et favoriser ainsi des partenariats entre chercheurs publics et chercheurs des entreprises du champ de la santé. Il est mis en œuvre à l’ITMO Santé Publique d’Aviesan. Le portail « Epidémiologie – France » fait le pari que la mise en partage de l’information sur les bases de données peut susciter chez les équipes de recherche des projets originaux de réutilisation des données disponibles ici ou là. Cette mise en partage peut également donner l’idée à des groupes de recherche de greffer des études complémentaires sur des enquêtes existantes.
Quels types de bases de données sont recensées sur le portail ?
Portail de données de la DREES
Catalogue et accès à des bases de données individuelles et administratives
La Direction de la recherche, des études, de l'évaluation et des statistiques assemble et collecte des données administratives, d'enquêtes et issus de modèles mis en oeuvre dans ses différents services. Elles peuvent être consultées selon les thèmes suivants : Système de protection sociale (29) ; Santé et système de soins (38) ; Retraite (10) ; Grand âge & autonomie (16) ; Minima sociaux & pauvreté (12) ; Handicap & invalidité (16) ; Enfance, famille et jeunesse (15).
Ce portail donne accès à la documentation ainsi qu'à un certain nombre de jeux de données. Les données individuelles sont livrées aux plateformes d'accès sécurisés.
Pour voir la présentation des données sur l'autonomie
par Layla Ricroch (DREES) lors de l'Assemblée générale de l'ILVV (2021)
Le CASD
Le centre d'accès sécurisé aux données
Pourquoi un accès sécurisé
Lorsque les données que l'on souhaite utiliser pour son projet de recherche sont protégées, par exemple parce qu'elles sont qualifiées de sensibles ou qu'elles sont directement ou indirectement nominatives, une procédure existe pour avoir l'autorisation de les utiliser par les instances compétentes (CNIL, comité du secret statistiques), puis pour accéder aux bases de données sans que celles-ci puissent être partagées par quiconque autre que le/la détenteur/trice de l'autorisation (la procédure d'habilitation est décrite ici). Une fois l'habilitation obtenue, on se tourne donc vers le CASD pour y déposer son projet et créer son espace de travail virtuel « étanche » dans lequel sont placés les données et les logiciels permettant de les analyser.
Une infrastructure sécurisée dédiée dite « de bulles sécurisées »
La SD-Box, boîtier informatique sécurisé d’accès, permet d’accéder à distance à une infrastructure sécurisée où les données confidentielles sont sanctuarisées. Cet endroit de stockage et de traitement des données est appelé « bulle sécurisée ». La SD-Box, spécifiquement conçue à cet effet, est très simple à installer, facile à remplacer, et est mise à jour à distance. Couplée à l’infrastructure informatique centrale « étanche », elle forme un ensemble cohérent de services maîtrisé de bout en bout garantissant le très haut niveau de sécurité que le CASD doit offrir aux producteurs de données.
Les Données
Dans le public, le CASD met aujourd’hui à disposition des données de l’INSEE, des ministères de la Justice, de l’Éducation nationale, de l’Agriculture et de l’alimentation, de l’Economie et des Finances pour les données fiscales… Pour ces dernières, un décret d’application précise explicitement que l’accès doit s’effectuer par le biais du CASD.
Dans le domaine de la santé, l’accès aux données de l’ensemble des séjours hospitaliers publics et privés en France (données PMSI de l’ATIH) ainsi qu’à certaines cohortes de santé est possible via le CASD.
Dans le privé, de nombreuses entreprises sont d’ores et déjà partenaires du CASD pour accroître la sécurité de leurs données en accès externe dans le cadre de collaboration avec des chercheurs, des start-up ou des consultants. Ces exemples s’inscrivent parfaitement dans la démarche actuelle d’«open innovation» mêlant à la fois savoir-faire métier, recherche, et capacités d’innovation des start-up.
- 376 sources de données mises à disposition de façon sécurisée (voir la liste complète des sources disponibles)
- 936 projets gérés et hébergés depuis son lancement (voir une sélection de projets utilisateurs du CASD)
Le catalogue des enquêtes de l'INED
Documentation et accès aux données des enquêtes produites par l'INED depuis 1945
Le serveur Nesstar de l'INED permet un accès en ligne, direct et gratuit, aux enquêtes que l'Institut National d'Etudes Démographiques a réalisées depuis sa création en 1945 (soit un peu plus de 200 références).
Pour chaque enquête :
- Consulter la documentation liée à l'enquête
- Parcourir les données documentées
- Voir et réaliser des tris à plat ou analyses simples
- Télécharger l'ensemble de la documentation
- Télécharger les matériaux de l'enquête (ex : questionnaire)
Les enquêtes à disposition depuis 2000 :
- Violences et rapports de genre : contextes et conséquences des violences subies par les femmes et les hommes (VIRAGE)- Volet Principal (2015)
- Etude des parcours individuels et conjugaux (Epic) (2013-2014)
- Fecondité, Contraception, Dysfonctions sexuelles - FECOND
- Migrations between Africa and Europe - MAFE
- Etude des relations familiales et intergénérationnelles - ERFI
- Familles et Employeurs - EFE
- Etude dans les services itinérants de jour et de nuit (2013)
- Enquête auprès des personnes fréquentant les services d'hébergement et les distributions de repas chauds (2012)
- Migrations - Famille - Vieillissement dans les départements d'outremer (2009-2010)
- Trajectoires et origines (2008)
- Enquête nationale sur les violences envers les femmes en France à l'Ile de La Réunion (2002)
- Enquête nationale sur les violences envers les femmes en France (2000)
- La période de naissance des enfants dans l'année (1999-2000)