Travail du groupe 2

De Movilab.org

Phase exploratoire

Le comment de l'open data !

Organisation interne

http://mobile.bva.fr/data/actualite/actualite_fiche/329/fichier_download22386.pdf: a partir de la page 39, il y a des infos et des questions interessantes pour l'organisation.


  • Service dédié

http://datablog.loire-atlantique.fr/le-pilotage-du-projet: exemple de service créé pour le début de l'opendata

Budget dédié à l'opendata ?

  • Publications de chacun

( * Nouveaux moyens techniques: nouvelle salle informatisée avec un acces à l'internet )

  • Marche à suivre entre: "on ve mettre ça en open data" et la publication: demande, validation, stockage en interne (sécurité), où publier
  • Publication par un particulier

Mise à disposition = Stratégie de publication des données

  • Quantité de publication

Facilité pour un utilisateur externe de trouver les données qu'il cherche -> classement précis, rejoint le service dédié.

  • Fréquence de publication: entretien et mise à jour des données

Ne pas laisser des données obsolètes

Si les publications sont trop fréquentes, les gens ne liront pas tout :-)

  • Forme de la publication

Format accessibles à tous. Ex de la SNCF et de ses horaires: incompréhensible.

Facilité d'acces pour les utilisteurs extérieurs

Facilité de compréhension: vocabulaire précis mais pas trop complexe

  • Données gratuites ou payantes ?

"60% des entreprises interrogées souhaitent pouvoir contrôler comment leurs données seront réutilisées, et 42% veulent cibler « ceux qui auront accès à leurs données ouvertes. »" http://mobile.bva.fr/data/actualite/actualite_fiche/329/fichier_download22386.pdf

Ex de la météo (suedois: passage du payant au gratuit:http://www.ladepeche.fr/article/2012/10/18/1468254-l-open-data-peut-il-devenir-payant.html)

  • Obstacles à la publication

Panne internet, hacker

Traitement de l'information

  • Tri -> Quoi !!

"Comment organisez vous la collecte de données au sein de votre ministère ? Quelle organisation avez-vous mis en place pour cette collecte ?

Dès le lancement en interne du projet il y a à peine un peu plus d’un an le ministère de l'intérieur a mis en place de façon pragmatique une gouvernance spécifique pour assurer, de façon pérenne, le recensement et la transmission des données sur data.gouv.fr.

Cette gouvernance repose sur un mode de fonctionnement en réseau liant étroitement le coordinateur aux « référents open data » désignés dans chacune des principales directions centrales, au sein des délégations dont le ministère assure la tutelle ainsi qu’à la préfecture de police. Ainsi, le ministère compte aujourd’hui 15 référents.

Des réunions internes et bilatérales avec Etalab permettent de faire un point régulier sur les données collectées, de lever les difficultés rencontrées et de définir des objectifs, en général, pour le semestre à venir."

Philippe Guiraud, coordinateur Open Data du Ministère de l'Intérieur: http://www.data.gouv.fr/Articles/Entretien-avec-Philippe-Guiraud-coordinateur-Open-Data-du-Ministere-de-l-Interieur


Rédaction

Traitement des données

Comme on l'a vu prédédemment, ouvrir ses données ne signifie pas publier tout et n'importe quoi. A partir de là se pose la question d'un éventuel traitement desdites données :

  • peut-on envisager de pratiquer une sorte de "censure" en ne publiant que certaines données et en occultant les informations les moins valorisantes ? Quoi qu'il en soit, les entreprises qui vont s'ouvrir à l'opendata vont publier des données qui seront partiales. Il y aura toujours des données qu'elles partageront plus facilement que d'autres. Ceci n'est cependant pas un obstacle à l'opendata, car cette partialité est une information en soi ; le fait qu'une entreprise ne publie pas telle ou telle information importante peut fournir une indication sur les difficultés éventuelles qu'elle connait dans le domaine concerné.
  • sous quelle forme l'information doit-elle être publiée ? Peut-on publier une information brute, telle quelle, sans la mettre en forme ou doit-on, au contraire, la rendre "présentable" ? Dans ce dernier cas, quel sens donner à ce "présentable" ? A ce sujet, on observe les deux orientations : si des sites d'opendata comme celui de l'INSEE publient de l'information brute (tableaux de statistiques, cartes, ...), d'autres sites proposent des données plus travaillées au niveau de la forme. On peut penser que la politique choisie dépendra des données que l'on publie : des données brutes pour des informations comme des statistiques, dans un souci d'être aussi objectif que possible, par exemple ; des données mises en forme pour une entreprise, qui a une image à entretenir.


Mise à disposition

Une fois ces constats établis, on peut s'intéresser aux modalités de la mise à disposition.

Organisation interne.

Lorsque le tri dans les données a été effectué, se pose la question de comment les diffuser sur internet.

L'idée qui semble la mieux adaptée est celle de la formation d'une nouvelle unité de travail dédié à l'open data. Ce système a été utilisé par exemple au ministère de l'intérieur où une équipe de 15 personnes est utilisée. La taille d'une telle équipe dépend de la taille de l'enreprise: mettre trois personne alors que l'entreprise ne comprend que 20 salariés est trop alors que si l'entreprise a 2 000 salariés, cela peut etre insuffisant. Elle peut aussi dépendre de la période: l'ouverture des données peut demander un personnel plus actif et plus nombreux que lorsque l'open data sera actif.

Evidemment l'ouverture d'un nouveau service a un coût. Il faut d'abord prévoir une nouvelle salle qui se doit d'être informatisée, ou alors utilisé une salle déjà existante mais cela risque de poser des problèmes (moins de place pour chacun et tous les problèmes liés à la cohabitation de services). Ce cout là peut atteindre 2 000€ selon la valeur de l'equipement actuel. Il faudra ensuite considérer le salaire des personne liés à cette mission, celui ci peut alors etre de 5000€ par mois en comptant les charges.

Le dernier point concernant l'organisation interne est celui du déroulement précédant la publication d'une donnée. Soit le service spécialisé s'occupe de rechercher en collaboration avec toutes les équipes les données qui méritent d'être publiés, soit chaque équipe apporte les données qu'elle veut publier, celles ci sont alors validés puis publiés. En comptant bien sur le traitement des donnés par le service, avant leur publication. La première solution semble plus efficace mais néccéssite un budget plus important.

On peut ensuite considérer la présence d'un archivage interne des données publiées: en cas de problème lié à internet, les données sont quand même accessibles.