Transcription du rendu avec les professionnels

Experts présents lors de séance de restitution[modifier | modifier le wikicode]

La dernière séance, le lundi 4 février 2013 nous aurons avec nous, pour débattre (liste qui évolue au fur et à mesure des confirmations) :

   de 9h à 11h : séances de présentations des travaux des binômes :
       Fabien Soler, Directeur Adjoint de Numélink sera présent physiquement dans la salle
       Michèle Grimaldi, Directeur de Projet, Responsable Communication, Casino I.T., sera présente physiquement dans la salle
       Françoise Paquienséguy, Professeur de Sciences de la Communication, Sciences Po Lyon, sera présente en visio
       Catherine Bocquet, directrice générale de SFI-Multimedia, Saint-Étienne, sera présente physiquement dans la salle
       David Réchatin, architecte numérique et gérant-associé d'Openscop, sera présent physiquement dans la salle
       Romain Blachier, Groupe OpenData 69, sera présent physiquement dans la salle

   de 11h à 11h45 : synthèse et échanges avec :
       Simon Chignard, Consultant et formateur indépendant, Auteur et Conférencier, sera présent en visio
       ...

Pour adapter vos présentations vous pouvez (devez ?) découvrir qui sont ces personnes. Notamment pour ce qui concerne Simon Chignard : http://donneesouvertes.info/

Groupe 1 : Impacts externes[modifier | modifier le wikicode]

Eléments de la présentation :

Présentation basée sur un exemple fictif d'une société de grande distribution. Analyse des impacts sur l’entreprise et les clients : création d’applications, de publicité pour le produit bio, etc. Analyse des impacts de l'ouverture des données issues d'autres acteurs sur l'entreprise : utilisation de ces données pour gérer les stocks, etc etc Analyse des impacts sur la concurrence : ouverture des données d'un concurrent plus tôt qu’eux, les clients n’auraient pas accès à leurs données, et se rabattraient sur les concurrents.

Pour l’entreprise l’open data peut être un moyen d’orienter sa stratégie marketing, pour le client c’est un moyen de s’approprier une marque et l’open data permet d’l’émergence de Start up qui développeraient des applications pour faire de la publicité.

Questions :

Argument sur la concurrence. Ce n’est pas un argument associé à l’Opendata, puisqu’il peut être associé aussi à n’importe quelle autre innovation technologique, nouveaux services et tout… On fait avec l’Opendata ce que l’on a fait avec les courses en ligne, le drive in. -> En fait c’est un mouvement d’ensemble. Si une entreprise ouvre ses données, les autres vont suivre le train pour ouvrir aussi leurs données.

Peut-on parler de production ? (cf schéma) C’est peut-être plus de la logistique, moins de la production. -> Gestion de stocks est un gros problème, donc c’est un bon argument d’exploiter les données externes pour mieux s’adapter.

Application créée par la société de grande distribution : Pourquoi faire de l’opendata si c’est pour utiliser leurs propres données ? Plus pertinent de dire : la société de grande distribution ouvre ses données, et une autre entreprise décide de faire une application pour exploiter ses données. -> On a parlé des start up, mais on peut voir ça de l’autre côté. La présentation s’est axée sur les impacts sur l’entreprise elle-même, pas sur les externes. Certaines entreprises laissaient du temps libre à leurs informaticiens pour créer des applis à partir des données ouvertes. Rien que le fait d’ouvrir les données à une filiale de la société de grande distribution est dans la mouvance Opendata. Confirmation par la responsable du service informatique de Casino (Casino Information Technology), il y a cette idée d’Opendata.

On a beaucoup parlé de Paris, etc etc, mais est-ce que la société déploierait des choses comme ça dans d’autres villes ? Possible pour toute la France, parce que les données de la RATP sont valables que pour Paris. Il faudrait des données sur les voitures, les flux des bus etc, dans chaque ville.

La rentabilité est difficile à calculer, c’est un effet global.

Les impacts extérieurs n’ont traité que les avantages. On peut aussi citer l'impact sur la R&D, par exemple d’externaliser sa R&D sur des services que l’on n'avait pas prévus a priori.

Groupe 2 : Feedbacks[modifier | modifier le wikicode]

Eléments de la présentation

L’importance de la boucle de retour et les bénéfices éventuels qu’elle peut apporter à l’entreprise. Boucle de retour : On a une entreprise qui mets à disposition ses données. Les acteurs externes vont faire un retour qui pourra être utilisé par l’entreprise elle-même. Pour l’instant, cette boucle de retour est peu présente dans le domaine de l’entreprise. On voit que la boucle de retour a marché (Wikipédia, open-source softwares). Pourquoi est-ce que ce n’est pas assez développé ? L’entreprise ne met pas à disposition les données que les utilisateurs voudraient ? Exemple : Les panneaux indicateurs de vitesse (radars pédagogiques) : retour qui montre aux conducteurs sa vitesse. Pourquoi la boucle est importante ? C’est le principal bénéfice que les entreprises vont avoir à ouvrir leur données : amélioration de leurs services par des retours externes. Améliorations de l’entreprise (en interne) et amélioration du service proposé aux clients. On peut donc faire des hackatons, des concours, …

Exemples :

La RATP qui a pu mieux cibler les attentes de ses clients. En effet, ils se sont rendus compte que beaucoup d’usagers sont intéressés par un service du type : Savoir où se placer dans le train pour se trouver le plus proche de la sortie voulue dans la station.
NHS (sécu sociale britannique) qui a rendu public ses données de prescription de médocs. Une startup a proposé au NHS d’économiser une très grosse somme d’argent en exploitant ces données.

Pour une entreprise, publier ses données permettra aux autres entreprises d’ouvrir leur données, et que chacune de ces entreprises pourra utiliser les données des autres.

Amélioration du fonctionnement de l’entreprise : Permettre une familiarisation à l’entreprise (valable surtout pour les grandes entreprises) Exemple d’EDF qui a publié en open source son logiciel destiné uniquement a priori à la recherche interne à l’entreprise. En fait cette publication permet au public de mieux voir ce que fait EDF en interne, et mieux comprendre ce qu’il se passe.

Innovations nouvelles dans l’environnement : exemple des machines agricoles que l’on améliore via des entreprises externes qui vont exploiter les plans, etc. Un ingénieur a décidé de construire lui-même sa machine, et a pu accéder à tous ces plans.

On peut donc avoir des innovations très surprenantes auxquelles on ne s’attendait pas du tout, grâce à cette boucle de retour.

Questions

Comment peut-on avoir une idée de ce que font les utilisateurs etc, à partir des données que l’entreprise publie ? aka comment l’entreprise récupère ces données modifiées ? -> Pour l’instant c’est le problème, difficile à trouver. Peu de personnes vont modifier les données et en faire un retour. Mais avec une grande ouverture et mise en avant de ces données, on peut espérer avoir des retours plus conséquents.

Est-ce que le partage des plans, des logiciels etc.. peut se rattacher à l’ouverture des données ? Oui

N’y aurait-il pas moyen de mettre en place des plateformes, etc etc, pour avoir ce retour ? L’idée d’un portail serait plus difficile à mettre en place pour une entreprise. C’est possible avec les données publiques, mais pour les grandes entreprises c’est dur, et encore plus pour les petites entreprises.

Il y a aussi un coté incitatif, dela demande, d’une start up, d’un développeur qui va dire « Moi je peux faire ça, est-ce que vous pourriez ouvrir vos données ? ». Il faut trouver quelque chose qui va inciter l’entreprise à ouvrir ses données. -> Certaines personnes se plaignent que comme quoi l’entreprise ne publie pas les données qu’ils veulent.

Groupe 3 : Classer les données[modifier | modifier le wikicode]

Questions :

C’est un pari à prendre au niveau de l’ouverture des données

Groupe 4 : Modalités de publication des données[modifier | modifier le wikicode]

Eléments de la présentation

Publier, c’est facile. Traitement des données. Est-ce que l’on peut mettre en place une certaine « censure » en publiant des données plus que d’autres. De toutes façons les données que l’on va publier, et le choix surtout va être partial. La partialité de ces données constitue en soi une information. Savoir sur quels points l’entreprise est frileuse. C’est donc en fait un avantage d’avoir une certaine partialité. Sous quelle forme publier la donnée ? -> Dataviz. Organisation interne pour l’opendata : Il faut créer une équipe qui va se charger de publier les données, trier etc.. La taille de l’équipe est variable, à adapter à la taille de l’entreprise. Il faudra un coût à faire marcher cette équipe, surtout au départ. On va avoir le passage aussi des données sous forme papier vers données numériques. Soit on a un traitement des données en amont, soit les publier puis les traiter. Quantité de publication, etc etc. Quelle quantité de données va-t'on publier ? On risque de noyer ce qui peut être important. A quelle fréquence publie-t-on les données ? Il faudra faire une sorte de classement aussi, pour l’utilisateur. Il faut aussi veiller à la mise à jour des données, puisque c’est un devoir de l’entreprise (cf publication des prix des produits). Gratuité de l’opendata ? On pense direct à gratuité, mais pas forcément. On pense à des services qui ont des services payants (météo en Norvège payante : rendu public : création d’emplois, etc etc). Les obstacles à la publication : le manque de moyens, la connexion internet, la sécurité des données, la vente des données que l’entreprise préfère, plutôt que de publier gratos.

Questions

Estimation des prix de mise en marche d’une équipe open data

Mise à jour des données : très bien d’en avoir parlé. C’est quelque chose que l’on estime mal et que l’on peut oublier. A relier avec le critère « qu’est-ce que je publie ? » car si l’on choisit des infos qui sont très volatiles, qui se mettent à jour tout le temps : ça peut être un frein à la mise en place de la publication. Il est clair qu’il est très important de tenir des données fraiches à disposition. Il faut la mise en place de processus automatiques pour l’opendata ! Parce que l’on se fatigue, on oublie, on est plus dans la mouvance de l’opendata.

Pour la recherche, on peut s’appuyer sur des statistques, même anciennes…

Mise en forme des données : Est-ce qu’on a des ratios ? Données publiques : brutes, données d’entreprises : Dataviz. -> Mise en forme car il y a une image à entretenir, faire quand même de la publicité.

Dans ce cas, est-ce qu’on est dans l’opendata ou est-ce qu’on est dans du marketing ? La publication sans le dataviz, c’est plus opendata. Dans le dataviz, on tend plus vers le marketing parce qu’on peut faire passer un message via la mise en forme des données.

Aujourd’hui les entreprises fournissent beaucoup d’informations traitées et publiées. Une manière de traiter l’opendata pour faire moins peur aux entreprises serait de fournir de la donnée brute qui est déjà disponible sur le web. Aka on a un joli pdf qui donne des données que l’on met à dispo de tout le monde, et mettre à coté un fichier brut qui répertorie toutes les données dont on s’est servi pour créer le pdf. Du coup on ne s’adresse pas aux mêmes personnes.

Groupe 5 : Fiabilité des données ?[modifier | modifier le wikicode]

Eléments de présentation

Il faut que les données soient fiables et qu’elles puissent être utilisées. Il ne faut pas utiliser des données fausses, mettre du bruit dans des données vraies qui rendrait l’exploitation de ces données impossible. Pourquoi est-ce qu’il y aurait des données fausses ? 2 types : des données brutes déjà erronées, ou des données traitées qui seraient influencées/falsifiées.

Données brutes : La récolte des données qui seraient elles-mêmes erronées. Entreprise qui utilise des données fausses. La falsification volontaire des données pour induire en erreur la concurrence. La publication des données obsolète s’il y a une latence trop importante entre la collecte des données et sa publication. Dans les 3 cas, si ces données finissent par être avérées fausses publiquement, on aura une très mauvaise image de marque de l’entreprise qui la pousserait à améliorer son processus.
Données traitées : L’entreprise a intérêt à publier uniquement les données qui lui assureraient une bonne image. Via le traitement et la sélection des données, on pourrait avoir une interprétation de ces données qui soit fausse. Traitement partiel de l’information : un concurrent qui va sélectionner ces données pour montrer uniquement les produits où il est plus compétitif. Jouer sur les critères de comparaison pour donner une information biaisée, avoir des contradictions etc etc. Problème d’échelle de mesure : une même donnée mais mesurée différent.

Comment vérifier les données ? Le recoupage d’informations : plusieurs sources qui publient les mêmes données : fiabilité. Indépendance des utilisateurs, développeurs : Ils vont prendre les données brutes et les traiter sans intention de falsifier les données, d’en cacher certaines, etc etc. Il vont préciser aussi selon quels critères ils ont classés..

L’avenir ? Une sorte d’auto-contrôle fournit par les utilisateurs (type wikipédia) qui pourraient mettre à jour des données de prix par exemple. Aka une entreprise de distribution : mise-à-jour des prix par les utilisateurs, pour les utilisateurs. Adopter ce modèle de wiki avec un système de contrôle et d’approbation des autres utilisateurs pourrait réduire les couts de l’entreprise, etc etc.

Questions

Cela dépend de quelles données on veut modifier, il y a beaucoup de recherches à faire avant. Si l’on voit que les concurrents modifient et falsifient les données, ils vont perdre toute crédibilité, etc etc. Il y aura une escalade des modifications : décrédibilisation des entreprises.

La question récurrente est celle de l’image de l’entreprise qui a à faire un choix entre l’ouverture des données et le coté marketing/business qui stresse les entreprises. Le jeu sur l’image que l’on a avec l’opendata, se joue aussi dans tous les domaines. C'est le cas également pour les organisations publiques. Tout vise à faire augmenter l’image de marque.

Plus on va mettre de contraintes dans le choix des données à publier, plus on va s’éloigner de l’esprit opendata.

On n’a parlé que de erronée/juste et « qui tend à fiabiliser l’information ». On aurait aussi des cas de publications de données qui sont correctes, mais dans un format inexploitable. -> Il faut essayer de tout publier, même dans un format texte mais joint avec une sorte de mode d’emploi.

Il faut faire attention à quand on parle des données accessibles. Parce que ça dépend des publics visés. Certains attendent des données exploitables, d’autres des données plus visuelles.

De nombreuses questions dépendent du domaine dans lequel on est. La question de la fiabilité peut être reportée sur la question de qui traite les données. Les données d’opendata vont bien sûr être traitées par des intermédiaires. Donc la fiabilité se pose sur quelle orientation va être donnée à la donnée par les intermédiaires.

Aujourd’hui dans les principes de l’opendata, il faut que la donnée soit brute. Mais on peut ne pas respecter les principes…

L’opendata va prendre sa puissance quand on va croiser des données.

Prenons du recul : présentation réalisée par Simon Chignard[modifier | modifier le wikicode]

L’opendata concerne déjà les entreprises. C’est un peu contre intuitif aujourd’hui. Ce n’est pas encore assez démocratisé cependant. Pour l’instant opendata = données des organisations et des services publiques. En matière d’entreprise, aujourd’hui cela ne concerne que les transports publics, les entreprises de réseaux (banques, distribution, assurances, …) et le secteur des ‘utilities’ qui ont commencé à publier les données. Le reste est fortement éparpillé. L’opendata des entreprises est donc une réalité même beaucoup d'actions restent à mener dans les autres secteurs. Par exemple pour les banques : partage des horaires des ouvertures de guichet, etc. Mais tout n’est pas opendata, il y a des critères pour que l’on appelle ça de l’opendata.

Les deux axes : quelles sont les données, et avec qui ? dans un mode opendata, il faut les partager avec tout le monde.

On a 3 univers d’opendata : opendata, demi-ouverture, semi-ouverture,… Il faut que l’entreprise se positionne sur ce qu’elle veut faire avec ces données.

Questions et discussions

Françoise : Différences stratégiques entre données publiques et les données non-publiques.

Simon : Les entreprises sont relativement peu concernées, à part les données personnelles. Aujourd’hui les acteurs publics jouent sur la transparence, la participation et le développement économique.

Dans les entreprises cette politique de transparence peut s’appliquer (cf l'équivalent EDF en Italie qui publie tout par souci de transparence). On retrouve ça aussi dans le secteur bancaire.

Michelle Grimaldi : Le curseur entre le site web externe plus axé « marketing » et l’opendata. Dans quelle mesure doit-on inclure du marketing parmi l’opendata ?

Simon : En gros « Pourquoi ouvrir ? ». Les premiers qui ont ouvert leurs données aujourd’hui sont les secteurs qui ont été très vite impactés par la réutilisation sauvage de leurs données. En gros, c’est de plus en plus simple de récupérer des données en ligne. L’opendata va permettre en fait de contrôler plus facilement l’usage de mes données. Si on reprend l’exemple de Casino, aujourd’hui l’horaire d’ouverture des magasins sont donnés par des sites webs qui ne sont pas le site de casino lui-même. La difficulté c’est de ramener les gens vers mon site. Mais est-ce qu’il ne serait pas mieux de dire « Ce que vous trouvez sur mon site c’est quelque chose que moi j’ai validé, et c’est bon c’est sûr ». C’est un enjeu sur les entreprises pour que chaque site web qui publie des données, publie des données qui sont de bonne qualité.

Concernant les données personnelles : Peut-on les partager ? Aujourd’hui tout ce qui est donnée privée, cf la CNIL, on ne peut pas les publier. C’est la CNIL qui prévaut sur ce que les entreprises souhaitent publier. On a des programmes de restitution des données personnelles : il ty a certain,es entreprises qui disent « j’accepte d’offrir à mes clients un accès à toutes les données que je possède sur ledit client » (cf banques, opérateurs téléphoninques, galeries lafayette…). La deuxième étape serait de dire que l’utilisateur a le contrôle sur les données que l’entreprise peut ou ne peut pas partager publiquement. En gros même les données personnelles peuvent venir dans le domaine de l’opendata via l’accord de l’utilisateur. Par exemple en Angleterre, l’utilisateur qui publie ses factures de téléphone, peut avoir un conseil via un site qui va trier toutes ces données en fonction de sa consommation et de ce qu’il paye. La barrière entre données personnelles et données publiées sont en train de changer dans l’open data.

Philippe : Mais donner accès à certaines données peut avoir des lourdes répercussions. Comment faire prenddre en compe à l’usager les risques qu’il prend ?

Simon : Aujourd’hui les participants sont volontaires. Les premiers tests montrent que beaucoup de gens découvraient que les entreprises avaient énormément de données sur eux. Pour faire le contrôle, on utilise des licences qui commencent à être créées pour les données personnelles. Par exemple Thomas St-Aubin qui crée en ce moment des licences pour les données personnelles.

Arthur : Comment être sûr que l’entreprise va respecter ses engagements ?

Simon : On a la CNIL, etc etc

Michelle, par l’intermédiaire de Philippe : Comment se positionner vis-à-vis des risques ?

Simon : L’opendata c’est pas le far west. Il faut instaurer des règles pour tout le monde. Il faut donc utiliser des licences, etc. On a plusieurs étapes : La licence, la marque (copyright, trademark, etc), API (Ca peut faire partie de l’opendata. Modèle d’API avec des clés pour tracer qui utilise, etc. Sans ça on ne peut pas savoir le nombre d’utilisateurs qui regardent les données.) et enfin l’animation/stimulation (qui est un élément très important. L’opendata marche pas tout seul, y faut stimuler les gens pour produire des infos pour animer et motiver via des hackatons, des concours,..)

Les concours ont changé de cible. Avant c’était des développeurs appli mobile, mais maintenant c’est plein d’autres professions, les cibles s’élargissent.

Olivier : Est-ce que à l’avenir on a déjà quelques idées de tendances pour les 5 ans prochains ?

Simon : On a déjà dit « Est-ce que l’opendata c’est pas juste un effet de mode ? ». Convaincu que l’ouverture des systèmes d’informations, complète ou partielle, est une tendance de fond. En fait l’opendata intéresse les entreprises aujourd’hui. C’est un effet global qui fait que de plus en plus d’entreprises voient la valeur des systèmes d’infos, et que la plupart des entreprises ont été frappées dont la manière comment les entreprises du web ont su créer du business via l’ouverture des données. Exemple : Entreprise de 2000+, les dirigeants ont tous lus comment Google fait des trucs,… C’est un peu un modèle à suivre au niveau du management, de l’ouverture et tout.

En fait aujourd’hui on a plus à disposition un panel d’options sur ce que j’ouvre, à qui et ce que je n’ouvre pas.

Conclusion : dans les stats, beaucoup d’élèves sont allés sur son blog à lui… :D

Quelques éléments de synthèse à chaud, feedback du groupe[modifier | modifier le wikicode]

Globalement, Simon nous a bien décrit l’environnement de comment les boites vont se comporter à l’avenir, quand nous on a sortir de l’école.

Il faudrait donner à ces personnes qui ont pris du temps avec nous des informations qui seraient exploitables par elles, parce que ça leur a pris toute une matinée.

Peut-être qu’il y avait besoin d’insister un peu plus avec l’entreprise et son environnement. On a en effet des enjeux sociétaux aujourd’hui. L’opendata a vraiment quelque chose à offrir aux entreprises. C’est une clé des entreprises.

Transcription du rendu avec les professionnels

Sommaire

Experts présents lors de séance de restitution[modifier | modifier le wikicode]

Groupe 1 : Impacts externes[modifier | modifier le wikicode]

Groupe 2 : Feedbacks[modifier | modifier le wikicode]

Groupe 3 : Classer les données[modifier | modifier le wikicode]

Groupe 4 : Modalités de publication des données[modifier | modifier le wikicode]

Groupe 5 : Fiabilité des données ?[modifier | modifier le wikicode]

Prenons du recul : présentation réalisée par Simon Chignard[modifier | modifier le wikicode]

Quelques éléments de synthèse à chaud, feedback du groupe[modifier | modifier le wikicode]

Soutenir Movilab

Movilab

S'impliquer

Explorer

Clavardons !