mercredi 30 décembre 2015

Fond IGN 25000 plus à jour (partout ?)



Phénomène très surprenant je viens de constater à plusieurs reprises, dans plusieurs zones géographiques différentes, que le fonds IGN au 25000 n'est plus à jour , contrairement à celui au  50 000 ou à celui correspondant à la définition plus précise du cadastre.

Ceci a été constaté à la fois sur l'application Iphigénie et sur le site IGN espace loisirs (donc tout ce qu'il y a de plus officiel). Je croyais, sans doute naïvement, que l'échelle de référence pour un institut géographique national était le 25000 ème. Il n'en est plus rien semble-t-il et le problème n'est pas nouveau.

Un exemple emblématique : le Puy-De-Dôme est le site de référence de l'Auvergne. Le funiculaire du Puy-de-Dome a été ouvert depuis plusieurs années, ce qui a entrainé la disparition de la barrière de péage et des parkings associés. Constatez sur ces images prises en direct des sites IGN le 30 décembre 2015 ce qu'il en est sur la carte au 25000 et sur celle au 50000. Nous avons du souci à nous faire quant à notre institut de géographie officiel !!!













mercredi 18 septembre 2013

Questions terminologiques

Sur « données », « corpus » et « base de données » 

 Tout d’abord revenons sur une question de terminologie à propos de « corpus » « données » et « base de données ». Une des définitions employée au niveau de l’Union Européenne indique qu’une base de données (BD) est :

“a collection of independent works, data or other materials arranged in a systematic or methodical way and individually accessible by electronic or other means.”

Cette définition distingue donc très peu une base de données d’un corpus, terme largement utilisé en sciences du langage. Généralement dans une base de données on distinguera plusieurs niveaux d’informations, soit, en termes plus généraux, une structure opérant sur ces données (incluse dans les données, ou distincte de ces données, tout leur en étant reliée). Le concept de corpus utilisé dans ce document implique également un niveau de structures sur les données (la TEI – Text-Encoding Initiative - est en un, par exemple, avec données et structures incluses dans un même document XML). 

Par ailleurs, le terme « base de données » est largement, voire utilisé uniquement par les milieux de l’économie ou du droit. Ceux-ci se sont évertués à poser quantité de régulations, de protections, visant à restreindre les accès aux données, à encourager les usages commerciaux. Chaque pays ou communautés de pays a, pour ce faire, décliné sa propre variante de définition de BD et ajouté des régulations spécifiques. Notre objectif étant ici de favoriser l’accès aux données de la recherche, quels que soient leurs formats, nous éviterons donc d’utiliser le terme « base de données ». 

 Dans le domaine des SHS, une autre raison pousse à éviter l’usage de ce terme. Beaucoup de disciplines, qui auparavant travaillaient exclusivement sur des approches qualitatives, ont progressivement découvert le travail quantitatif sur les données, et cede façons très spécifiques, à travers quelques logiciels particuliers et des modèles singuliers, en général en rapport avec le modèle « relationnel ». Les bases de données y sont donc uniquement relationnelles. Cette concentration a voilé aux yeux des chercheurs l’existence même du modèle, le fait que le travail dépendait d’un mode unique de représentation et de traitements des données. Or aujourd’hui, d’une part, les modèles (et les outils associés) permettant de structurer et d’annoter les données sont plus variés et riches (c’est l’un des grands enjeux d’apprendre à les connaître pour faire une recherche différente). D’autre part, avec le développement du travail sur les grandes masses de données (Big Data), la structuration des données n’est plus un pré-requis, voire doit même être oubliée avant de procéder aux traitements (la rupture méthodologique est alors complète).

 Nous n’utiliserons donc pas dans ce document le terme « base de données », mais celui de « données » ou de « corpus » (si cela concerne les données traitées, par exemple, en science du langage).

Colloque international « Open Data : enjeux communicationnels et sociétaux »

Colloque international « Open Data : enjeux communicationnels et sociétaux » Clermont-Ferrand, jeudi 7 et vendredi 8 novembre 2013

 " Quelle est l’importance sociétale et communicationnelle de l’Open Data en France et à l’étranger ? L’ouverture des données peut-elle susciter un renouveau démocratique en Europe ? Quel(s) intérêt(s) représente l’Open Data pour les collectivités et les territoires ? Dans quelle mesure les entreprises peuvent-elles s’inspirer des initiatives lancées par le secteur public ? Quel est le rôle de la médiation dans le processus d’ouverture de données ?" (texte provenant du site du colloque )

Ce colloque est intéressant pour de multiples raisons. Pour moi, il s'agira de comprendre comment les autres de la société "civile", comprennent les enjeux, ce que sont ces données qu'ils veulent ouvrir, pour en faire quoi.

Les données de la recherche sont peut-être d'une nature différente et s'inscrivent dans un rapport spécifique avec la façon de travailler du chercheur, de produire de nouvelles connaissances. Suivant les disciplines (ou plutôt domaines de connaissance et d'investigation) , la nature de ces données varie fortement, ainsi que les méthodes de travail. 

Donc au stade où l'on en est, il s'agit, d'une part,  d'établir une classification du champ "Open Data" de façon à éviter que la vision de quelques acteurs se présente comme universelle (applicative en bloc à la problématique des institutions et collectivités, d'une part, et, d'autre part, de la recherche; et applicative de façon unilatéral à toutes les domaines de recherche académique). D'un autre côté, une fraction notable de disciplines universitaires doivent modifier leur approche de la mise à disposition des données de leur recherche, les rendre accessible de façon standard, en distinguant les différents niveaux de données.

A viewpoint on the place of CALL within the Digital Humanities: considering journals, research data and the sharing of research results


samedi 6 avril 2013

La confusion sur les droits d'auteur façon Europeana

Comme expliqué dans le message précédent Europeana est le projet censé répondre à "l'infâme" projet de Google dont l'émission de Arte nous a répété à plus soif qu'il portait fondamentalement atteinte aux droits des auteurs (tout le monde ne disait pas cela dans le documentaire, mais, comme d'habitude, ce que recouvre la question du droit d'auteur n'a pas  été abordée dans l'émission ; mieux vaut discourir en se basant sur des idées préconçues).

 Voici ce qui apparait sur la page de Europeana lorsqu'on recherche un ouvrage de Clément Marot - dont on pourrait naïvement croire que ses oeuvres sont du domaine public). Vous noterez que sur cette fiche de l'ouvrage "Oeuvres De Clement Marot Valet-De-Chambre De François I. Roy De France" (1731) détenu par la Bayerische Staatsbibliothek, figure, juste à côté du cadre invitant à "lire", la mention de  la licence "CC0 No rights reserved".



Si vous allez sur le site de Creative Commons, vous pourrez  lire à propos de CC0 :
  •  "The person who associated a work with this deed has dedicated the work to the public domain by waiving all of his or her rights to the work worldwide under copyright law, including all related and neighboring rights, to the extent allowed by law.You can copy, modify, distribute and perform the work, even for commercial purposes, all without asking permission. "
Cependant en cliquant sur le lien "lire", cela vous conduit au site de la bibliothèque. Si vous désirez télécharger l'ouvrage (PDF-image, pas de texte, qualité discutable), vous devrez par deux fois taper des codes et affirmer que c'est uniquement pour votre usage personnel.


Enfin lorsque vous ouvrirez le PDF, vous pourrez y lire immédiatement les droits associés.






En somme, la licence CC0 a été violée plusieurs fois. En effet, s'il faut affirmer que l'on ne veut en faire qu'un usage personnel (autrement accès interdit), c'est que les droits sont restreints. De plus, la bibliothèque vous indique qu'elle en a les droits exclusifs.

Quel mépris pour le travail de Creative Commons et quel mépris pour cette question des droits !

 Ceci illustre effectivement un problème récurrent dans les débats sur  la question de l'accès libre : un certain nombre de personnes (institutions) influentes qui y sont opposées et crient au scandale sur la question des droits d'auteurs ne respectent pas le droit.

Par ailleurs, on peut s'interroger sur la façon de concevoir l'accès aux savoirs de cette bibliothèque allemande. Elle semble avoir beaucoup d'ouvrages de Clément Marot. Ces ouvrages sont certainement fragiles. Si vous êtes intéressé par ce texte, vous n'aurez pas le temps d'aller le lire sur place ou, dans le cas contraire, il est probable que vous ne soyez pas autorisé à le toucher. Ce PDF représente donc (peut-être) l'unique possibilité de "lire" (dans de biens mauvaises conditions) ce livre. Les textes de Clément Marot font partie du domaine public. Mais cette bibliothèque qui en possède beaucoup  (a le monopole sur ces ouvrages ?) utilise le subterfuge de la numérisation pour vous interdire de faire quoi que ce soit sur le texte (en dehors de la lecture intime).

 Bel  exemple de soi-disant ouverture de tous au savoir et belle illustration de la très relative notion de  "domaine public".

NB : toutes les images datent du 5 avril 2013



Le franglais version Europeana et Jeanneney

La chaîne Arte diffuse en ce moment un documentaire intitulé "Le livre selon Google", reportage assez intéressant mais un peu trop superficiel. Comme on le sait l'initiative de numérisation de beaucoup de livres dans le monde (dont une large fraction indisponibles, orphelins) a suscité beaucoup d'émois. Certains ont été intéressés par cette initiative et y ont entr'aperçu un manque important dans la diffusion de l'information et des savoirs (comme les directeurs bibliothèque de Harvard, ou d'Oxford par exemple). Ces mêmes personnes ont ensuite marqué leur distance sur certains modes de fonctionnement de Google (dont l'intention de garder l'exclusivité sur ces ouvrages épuisés, orphelins) et, notamment, le risque de monopole. 

D'autres ont marqué d'emblée leur hostilité à un tel projet et ont accueilli avec une condescendance extrême les personnes de Google. Jean-Noel Jeanneney, qui a été le responsable de la BNF et était présenté dans l'émission comme celui de son ancien site, fait partie de ces personnes. Une des premières choses qui l'a choqué est le fait que Google ait pu mettre en ligne des textes de Hugo en anglais et non, d'abord, en français. Ceci est la réaction chauvine habituelle de certains en France (d'ailleurs justement rappelée par un autre personne de Harvard). 

Mais que penser alors de ce qui apparaît sur le site Europeana, projet présenté comme la grande alternative à Google pour lequel Jeanneney a été fier de clamer la paternité du nom du projet et y a investi la BNF. 

Voici ce qu'on peut lire, après avoir sélectionné la langue française dans le menu de la page d'accueil, ici : http://www.europeana.eu/portal/usingeuropeana_search.html (en l'état du 5 avril 2013) , page destinée à donner des explications sur la façon de faire des recherches. Ceci n'est qu'un exemple parmi les autres pages de présentation / explications de ce site.
J'avoue nettement préférer lire Hugo en anglais qu'essayer de lire ce qu'on me présente ainsi pour du français :-( Ceci n'est pas anodin, mais témoigne de la façon dont on a considéré le projet de Google. Afficher des pages incompréhensibles censées expliquer comment Europeana fonctionne reflètent-elles la volonté d'ouverture de l'accès aux savoirs qu'on y pourrait trouver ? 

samedi 10 novembre 2012

Week-end de découverte de la randonnée les 15 et 16 septembre 2012 avec le Club Alpin de Clermont-Ferrand

50 personnes dont 26 non cafistes






WE rando montagne avec le Club Alpin 15 et 16... par Letephe