OpenData

Donnée ouverte : fait auquel on n'apporte aucune valeur ajoutée et qui a vocation à être librement accessible et réutilisable.

Commencer

Si l’on prend le temps de l’examiner, on se rend facilement compte que notre environnement est constitué d’une multitude de données. Nous en produisons tous les jours, de la simple personne à l’entreprise, qu’on le veuille ou non. Celle-ci lorsqu’elle nous est présentée peut sembler sans réelle valeur : la température en un lieu, le nombre d’habitants d’un pays, ou les horaires de passages d’un bus. Pourtant si l’on regarde de plus près, elle commence à devenir source d’une multitude de nouvelles activités, pour ceux qui tentent de tirer profits de ces nouvelles masses de données. Le développement d’internet et des outils numérique joue le rôle d’un accélérateur : le web est une source quasi inépuisables de données et le numérique offre de nouvelles opportunité pour les exploiter et faciliter leur circulation.

Création

Données de l'Etat

Données des collectivités

Traitements

Format : compatible et adapté à un traitement de l’information

Anonymisation

Mise à disposition

Le choix d'une infrasctructure

Licences

Ré-utilisation

Emergence de services, transparence de l’état

Nouveau modèle de développement

Anonymisation

Main d'oeuvre

Hébergement (serveurs)

Entretiens

Génération de bénéfices

Plusieurs licenses (incompatibles)

Coût d'accès aux données

Produire la donnée est la première étape de sa vie, il faut la récupérer (on parle de collecte). Ensuite vient l’utilisation en elle même : on vient lui donner de la valeur en la transformant en information (la mettre en contexte). Dans une logique Open Data, il s’agit ensuite de ne pas laisser “mourir” la donnée, car bien qu’elle soit produite pour une utilisation précise, elle peut connaître une seconde vie, voir même gagner en valeur si elle est utilisée pour d’autres applications. Pour cela il est nécessaire de rassembler les données pour en obtenir une grande quantité, et de les « nettoyer » en les exportant dans un format interopérable qui facilite leur traitement et leur « réutilisation » pour des usages dont bien souvent on ne soupçonnait pas l’existence.

Un problème se pose cependant. Bien que ce cycle semble simple, faire vivre la donnée a un coût. Non seulement à sa production, mais également lors de son traitement et de sa redistribution. En effet, pour qu'elle puisse être utilisée par le plus grand nombre, certaines problématiques peuvent se poser : qui est responsable financièrement de la rendre exploitable pour tous ? Qui doit assumer les coûts liés à la mise en place des infrastructures nécessaires à sa redistribution ? Également, certaines données sensibles comme celles relatives à la santé donnent lieu à des problèmes d’anonymisation.

Tous ces coûts, il faut les assumer, mais qui est responsable? Les pouvoirs publics ? Les réutilisateurs ? Comment faciliter l’innovation économique et sociale tout en assurant une juste répartition des coûts ?

Carte de la controverse

Pour apporter des éléments de réponse à la problématique du coût et de la valeur des données, il faut s’intéresser au paysage actuel de l’Open Data, notamment sur Internet. Le web est en effet le principal vecteur de données publiques, et permet l’existence de plateformes publiques, que chaque internaute peut consulter, utiliser, etc. Mais le web est aussi un lieu de partage où chacun peut contribuer (ex : openstreetmap.org), et où émergent les innovations. De nombreuses start-ups surfent sur la vague de l’Open Data, en proposant par exemple des services d’extraction ou de visualisation des données. Enfin, une communauté active et diverses associations cherchent à défendre les principes qu’ils jugent inhérents à l’Open Data.

La carte ci-dessous vous offre une vue globale de la controverse et du rôle des différents acteurs. Quels sont ceux qui sont impliqués aujourd’hui dans le “mouvement” Open Data ? Qui est plus frileux sur cette question ? La réponse est ici. De plus la carte offre une dimension supplémentaire en vous permettant de visualiser les attentes et les arguments qui justifient les prises de position de chacun.

Voir la carte Lire le rapport général de la controverse

Historique

Le phénomène de l’Open Data est très récent en France. Il a principalement été initié aux Etats-Unis dans le contexte du « Freedom of Information Act ». Pourquoi alors est-il important d’étudier sa chronologie en France ? Tout simplement parce qu’il s’agit d’un mouvement encore jeune, dont le cadre juridique et social est en train de se définir et les lois qui le régissent sont soit floues, soit mal appliquées.
Avec la création de l’Open Data et la création d’Etalab, plusieurs questions importantes restent à se poser : quels sont les domaines dans lesquels les données peuvent être prélevées (loi du 17 juillet 1987) ? Comment traiter séparément les données privées et les données publiques (avec les licences par exemple) ? Qui plus est, pour toutes les questions qui se posent au fur et à mesure de l’avancement de l’Open Data, il faut savoir comment légiférer dans ce domaine (consultation par la CNIL dans le but de modifier la loi).

En résumé, le concept est relativement récent et nous observons un phénomène « en train de se faire », regarder en arrière nous permet de voir quelles questions les acteurs se sont posés et comment ils ont tenté d’y répondre.

Voir la frise Lire la revue de presse

1966

Freedom of Information Act (USA)

Signée le 4 juillet 1966, cette loi américaine oblige les agences fédérales à transmettre leurs documents, à quiconque en fait la demande, quelle que soit sa nationalité. Fondée sur le principe de la liberté d’information, elle a été votée dans le contexte de la guerre du Viêt-Nam. Certains domaines sont exemptés : tels que les documents relatifs à la sécurité nationale, à la vie privée ou certaines informations géographiques.

1978

6 janvier : Promulgation de la loi informatique et liberté

C’est la loi assurant la protection des données personnelles disponibles sur tout support informatique. Elle s’applique donc aux données recueillies dans le cadre de l’Open Data.

17 juillet : Promulgation de la loi relative à la liberté d’accès aux documents administratifs et à la réutilisation des informations publiques - Création de la CADA

Cette loi oblige la plupart des entités administratives à publier les données qui sont en leur possession, moyennant un coût nul ou “raisonnable”. Elle crée également la CADA, chargée de s’assurer que cette loi est bien appliquée.

2002

16 décembre : Création des premières licences Creative Commons

Ce sont les premières licences permettant la diffusion de données de manière peu restrictive.

2005

30 décembre : Décret pris pour l’application de la loi du 17 juillet 1978

Il formalise la manière dont les institutions sont tenues de répondre lorsque l’on demande l’accès à certaines de leurs données.

2006

Mars : « Give us back our crown jewels » (The Guardian)

Publié dans le supplément technologie du Guardian, cet article s’oppose à la commercialisation par le gouvernement britannique des données, produites grâce aux fonds publics. Cette situation est perçue comme une manière de faire payer deux fois le contribuable qui chercherait à accéder à ces données. Dans cet article est souligné également l’aspect contre-productif d’une telle politique constituant un frein à l’innovation.

2007

Décembre : Réunion de Sébastopol (Californie)

Ce rassemblement de 30 personnes a pour mission de définir ce qu’est une donnée ouverte. Une liste de 8 critères est élaborée pour les données publiques ouvertes (Open Government Data). Leur objectif était de définir le principe et peut-être même de le faire adopter aux candidats aux prochaines élections américaines. Le thème de l’open data sera repris par l’administration Obama.

Création de l’Open Database License

La première licence destinée non pas aux informations, mais à la base de données dans laquelle elles sont triées.

2009

Mars : Création de la licence CC0

C’est la licence la moins restrictive possible. Elle s’approche du domaine public, aux restrictions légales relatives à chaque pays près.

Mai : « We want raw data, now ! » (Tim Berners-Lee)

Le britannique Tim Berners-Lee est considéré comme l’inventeur du World Wide Web. Mais même si le web est ouvert, certaines données restent disséminées, enfermées dans des silos, et ne sont pas naturellement interopérables. Lors d’une conférence TED, il encourage l'ensemble du monde à libérer ses données afin de les connecter entre elles. Il milite alors pour l'open access et cela concerne autant les institutions politiques (il interpelle directement Barack Obama), les entreprises, les scientifiques, les universitaires mais aussi chaque personne car « chaque aspect de la vie génère des données ».

Ouverture de data.gov (USA)

Il s’agit d’un site web géré par le gouvernement fédéral américain, afin de rassembler et de rendre publiques les données collectées par le gouvernement.

Ouverture de data.gov.uk (GB)

2010

Octobre : Plateforme de la métropole rennaise

En France, la métropole rennaise est pionnière en matière d’ouverture des données publiques. Pour accompagner cette démarche, Rennes Métropole a organisé un concours d'applications, récompensant des services innovants élaborés à partir de ces données.

2011

21 février : Création de la mission Etalab chargée de la création du portail data.gouv.fr

C’est une mission placée sous l'autorité du Premier ministre qui est chargée de « la création d'un portail unique interministériel des données publiques », à savoir le portail « data.gouv.fr » qui doit rassembler et mettre à disposition gratuitement les informations publiques de l’état

29 avril : Création du Conseil National du Numérique

C’est un organisme consultatif créé sous le gouvernement de Nicolas Sarkozy. Il a pour mission « d'éclairer le Gouvernement et de participer au débat public dans le domaine du numérique ». C’est dans ce cadre qu’il a publié de nombreuses recommendations sur l’Open Data. Il propose notamment d’étendre le périmètre des données publiques soumises à publication aux EPIC (établissements publics industriels et commerciaux) et de mettre en place un standard de publication qui faciliterait leur réutilisation.

26 mai : Circulaire de François Fillon

Elle demande à tous les services de l’état de faciliter l’accès aux données publiques en leur possession, notamment en imposant leur gratuité.

Juin : « La RATP veut garder ses données pour elle »

La RATP fait alors valoir qu'elle possède les droits sur la carte du métro utilisée dans l’application pour smartphone “Check My Metro”. La RATP endosse alors le mauvais rôle en faisant le choix de garder ses données privées, ce que beaucoup jugent incohérent.

Octobre : Création de la licence ouverte par Etalab

C’est une licence spécialement conçue pour la diffusion de données dans le cadre de l’Open Data.

Décembre : Ouverture de la plateforme française data.gouv.fr

Etalab coordonne l’ouverture des données publiques en France. La plateforme heberge les données produites par les administrations de l’Etat. Les collectivités locales et les autorités administratives indépendantes ont été également invités à ouvrir leurs données publiques sur data.gouv.fr.

2012

Octobre : Ouverture de la plateforme data.ratp.fr

2013

6 mars : Début de la consultation de la CNIL à propos de l’Open Data

La CNIL commence à comprendre l’enjeu de l’Open Data: « L'Open Data répond à l'exigence de renforcer la transparence de l'action de l'administration en opérant un élargissement et un approfondissement des droits à l'accès aux informations publiques. Il peut sans conteste donner lieu à de nouveaux services. ». A l’issue de cette consultation, elle proposera donc peut-être une évolution de la loi informatique et liberté favorisant le développement de l’Open Data.

Acteurs

L’ouverture des données (Open Data) concerne en premier lieu les collectivités et les organismes publics. Ce processus a d’abord pour but la mise à disposition des données publiques aux citoyens et aux entrepreneurs susceptibles de les réutiliser. Mais cette tendance n’est pas unilatérale, et le privé comme les associations sont à l’origine de nombreuses initiatives dans le domaine de l’Open Data, et sont aussi amenés à s’exprimer sur les modalités d’accès aux données. Cette question se pose également de manière pertinente aux établissements publics, dont les modèles économiques reposent, pour certains d’entre eux, sur la vente de données. Tous les acteurs n’ont pas le même point de vue et les rapports sont parfois conflictuels : certains refusent de libérer leurs données pour ne pas avoir de frais supplémentaires ou pour préserver leur business model, quand d’autres refusent de payer quoi que ce soit alors qu’il produisent de la richesse.

Le tableau interactif, ci-dessous, recense quelques-uns des acteurs les plus actifs sur le sujet. Vous y trouverez la position tenue par chacun ainsi qu’une description de la manière dont il est engagé dans le débat.

Voir les acteurs Lire le rapport du webographe

LiberTIC

LiberTIC est une association nantaise fondée en 2009. C’est un des membres les plus actifs du mouvement Open Data français. Ses arguments sont que la libération des données profite à tous les acteurs, car les collectivités rationalisent et valorisent leur patrimoine immatériel, les entreprises y trouvent un terreau à la création de services innovants, les chercheurs ont les éléments sur lesquels développer de nouvelles études et les citoyens accèdent aux informations de la vie publique

Sunlight Foundation

La Sunlight Foundation est une association américaine créée en 2006. Son domaine d’action principale est la transparence et la résponsabilisation du gouvernement et de ses actions. Ainsi elle s’est engagée dans le mouvement Open Data car ce dernier offre les données qui lui permettent de surveiller les actions de l’Etat et de les rendre publiques grâce aux différentes applications mobiles qu’elle a développées.

Open Knowledge Foundation

L’Open Knowledge Foundation est une organisation à but non lucratif britannique fondée en 2004. Elle est dédiéé à la promotion de l’Open data et des contenus libre sous toutes leurs formes. Elle a développé l’infrastructure logiciel derrière les portails data.gov et data.gov.uk et c’est grâce à ses qualités techniques qu’elle s’est imposée au niveau européen. Pour elle l’Open Data permet d’améliorer la culture, la recherche, la gouvernance et l’économie.

Etalab

Etalab est le service public qui gère la politique française de l’Open Data et administre le portail français de libération des données data.gouv.fr. Créé le 21 février 2011 à la demande de François Fillon. Il a également dévellopé la licence ouverte qui s’applique aux données libérées par l’Etat. Sa position est relativement neutre dans la mesure où son seul rôle est de gérer l’infrastructure de mise en ligne des données et non les coûts de fabrication de ces dernières

IGN

L'Institut national de l'information géographique et forestière, est un établissement public à caractère administratif ayant pour mission d'assurer la production, l'entretien et la diffusion de l'information géographique de référence en France. Son rôle dans l’Open Data français est compliqué car sa seule source de revenu est la vente des données qu’il collect. Ainsi cet acteur est réticent car s’inscrire dans une libération gratuite des données entrainerait sa faillite.

RATP

La RATP est un Etablissement Public à caractère Industriel et Commercial (EPIC). Ainsi grâce à ce statut elle n’est pas concernée par la loi qui impose la libération de ses données sous format libre. Elle est fortement réticente à cette libération comme le prouve le procès qu’elle a fait lorsqu’une application de carte du réseau du métro parisien a été mise en vente. Il est à noter que le réseau de transport de Rennes a choisi de libérer ses données.

SNCF

La SNCF est un Etablissement Public à caractère Industriel et Commercial (EPIC). Un peu moins réticente que sa petite soeur la RATP, elle se met petit à petit à l’Open Data en libérant par exemple les probabilités de retard par trajet. Cependant elle n’en fait pas encore une politique généralisée pour des raisons de coûts et de modèle économique (ces données à présent gratuites étaient vendu avant).

Rennes métropole

Rennes Métropole et la ville de Rennes met à disposition des données publiques, issues notamment de son réseau de transport, ainsi que des informations géographiques. Collectivité pionnière en France dans le domaine de l’Open Data, elle a été suivie entre autres par Nantes, Paris ou encore le conseil général de Loire-Atlantique. Notons que la métropole rennaise met à disposition ses données sous une licence propre : la licence Rennes Métropole.

Data Publica

Entreprise française, Data Publica s’est spécialisée dans le marché de la donnée. Elle propose différents services, notamment pour l’extraction, l’enrichissement et la visualisation des données.

JC Decaux

Bien que qualifié ici de contributeur à la libération des données, JC Decaux a eu été longtemps réticent vis-à-vis de ce mouvement. En effet, ce dernier a autrefois averti que les données sur les Vélib étaient leur propriété intelectuelle. Aujourd’hui, ses positions ont changé. Les données des Vélib ( horaires de disponibilité, situation des bornes) sont diffusées en Open Data sur son site internet. Il qualifie donc les Vélib de précurseur dans le domaine de l’Open Data et espère la création d’applications à partir de ces données.

CheckMyMetro

L’application Check my metro! est une application gratuite sur l’App Store et qui proposait à ses utilisateurs plusieurs services. Elle proposait ainsi une carte du métro de Paris, les horaires des métros suivants… et se positionnait donc comme partisante du mouvement de l’Open Data. Cette application n’a cependant pas pu continuer à diffuser ces informations pleinement, car la RATP a considéré que certaines informations étaient disponibles sur leur propre application payante : « RATP Premium ».

Dataveyes

Datav’eyes est une start-up française spécialisée dans le dévellopement d’outils de visualisation de données interactifs. Cette dernière est favorable au dévellopement de l’Open Data car il lui apporte plus de clients.

Qunb

Qunb est une jeune start-up française qui travaille dans le domaine de la data visualisation. Leur spécialité est de récupérer de grandes bases de données et de les présenter sous une forme plus agréable à l’utilisateur. En particulier elle profite de l’Open Data car ce dernier lui apporte ces données si précieuses.

Simon Chignard

Il a participé dès 2010 à l’ouverture des données publiques de Rennes Métropole, territoire pionnier en France. Conférencier, il intervient régulièrement sur le sujet et a publié plusieurs articles sur l’approche politique, sociale et économique de l’open data. Consultant et formateur indépendant, il est à titre bénévole président de l’association Bug (innovation sociale et numérique) et vice-président de la Cantine numérique rennaise.

Législation

Le développement de l’Open Data a beau être assez récent, le texte juridique principal qui entoure la diffusion des données publiques est lui plutôt ancien. Nous nous attacherons donc particulièrement ici à décrire les différents textes qui ont eu pour effet de remettre la loi “CADA” au goût du jour, tout en s’appuyant sur les fondamentaux initiés par celle-ci.

De plus, la question des licences de distribution des données est un enjeu majeur pour leur libre réutilisation, nous vous présenterons par la suite celles d’entre elles qui s’appliquent particulièrement bien à notre problématique.

Voir la législation Lire le rapport du juriste

Débat

Comme vous avez pu le remarquer la controverse est trop jeune pour penser avoir trouvé La solution qui puisse mettre tout le monde d'accord. La question est néanmoins pertinente car elle touche une pratique qui se démocratise de plus en plus, personne ne remet en cause le progrès et la richesse que peut apporter l'Open Data. C'est sur son cadre où le débat est à faire, et c'est une problématique suffisamment importante pour qu'elle puisse s'adresser à tous et non uniquement aux acteurs majoritaires.

C'est dans cet objectif que la présente partie existe : vous laisser vous exprimer avec votre sensibilité sur un cadre idéal dans le lequel l'Open Data serait le plus à même de prospérer. C'est une question délicate, et on espère vous avoir donné des éléments suffisamment pertinents pour que vous puissiez au mieux y répondre.

Participer au débat

comments powered by Disqus