Edition 2016

4035 - full - crd_page - medium

Qu'est-ce que la donnée?

Thème

Le thème des Journées de Rochebrune change tous les ans. Pour sa 23e édition, Rochebrune se consacre aux données.

Les données sont au cœur du processus scientifique. Elles servent tantôt à formuler des hypothèses (abduction), à affiner les hypothèses (induction) et à infirmer ou confirmer les hypothèses (déduction). Traces de phénomènes passés, présents ou à venir, il est naturel et nécessaire de les associer à tous les moments de la construction de la connaissance scientifique. Les données revêtent alors une importance capitale dans l’élaboration de la science moderne.

Poser la question des données c’est aussi s’interroger sur leur qualité, leur accessibilité, leur coûts voire leurs utilisations. Ces questions renvoient à d’autres problèmes, comme celui de leur élaboration et de leur acquisition.

Pourtant la nature des données, leur statut épistémologique demeure la source d’un questionnement constant tant du point de vue de leur création, que de leur utilisation ou de leur partage ; que sont les données, comment dépasser leur limites, leurs imprécisions, comment en disposer d’assez sans en avoir trop, comment les échanger et les transmettre, comment les décrire et les modéliser, comment les simuler, ou plus simplement comment travailler avec des données. Ces questions s’expriment plus encore face à des objets remarquables tels que les système complexes, dont le comportement nous est, par définition, inconnu et dont la frontière entre le phénomène et le contexte demeure floue. Les données y sont alors tour-à-tour source de connaissance mais aussi de doute ou d'erreur, marque indélébile de notre ignorance

Face à ces nombreuses interrogations qui transcendent les disciplines et les objets d’études, les 23e journées de Rochebrune 2016 ont pour objectifs de dresser les contours d’une réflexions sur les données dans les systèmes complexes naturels et artificielles et à travers ce prisme d’étendre la question de la nature des données en science.

Axes de réflexion possibles

  • Définition des Données — les données sont utilisées tantôt comme des traces d'un phénomène, des donnés, des informations, des connaissances voire des preuves. En anglais, « data » est pluriel si ce sont des faits, singulier si ce sont des informations. Quel est alors la nature des données, leur définition, de quoi leur statut dépend-il, existe-t-il des règles d’usage communément admises, comment se construit le dialogue scientifique dans ce pluralisme de sens.
  • Données et Méthodes — travaille-t-on avec les même méthodes suivant si les données sont captés, construites ou produites ou transmises ? Les données ne sont jamais "pures", elles sont toujours le fruit d'un processus qui les a mises à disposition des sens d'une manière ou d'une autre. Dans ce cadre, doit-on tenir des modes d’acquisition dans les méthodologies, et si oui comment en tenir compte ? Commence-t-on toujours par avoir des données avant de modéliser ou bien peut-on procéder / amorcer le travail du scientifique sans données à priori ?
  • Données et Métadonnées — toute donnée qui quantifie ou qualifie un phénomène peut à son tour faire l’objet constituer une nouvelle trace exprimée par d’autres données qui deviennent alors des méta données, ou données à propos des données. Quel est le statut des méta données. le niveau méta peut-il lui même être expliqué par des « méta méta » données, le « méta » est-il à invariance d’échelle ? 
  • Digital et Analogique — données numériques ou données analogiques. Depuis le début des années 1990 Nous faisons face à une l’avalanche de données numériques mais aussi à la résurgence de capteurs physiques notamment via le phénomène fablab/hackerspace qui favorisent les données analogiques. Quelles sont les différences entre ces données, Comment passer de l’un à l’autre ?
  • Small Data / Large Data / Big Data — les incontournables big data sont à la mode mais s’agit-il vraiment de la révolution annoncée ou d’une simple évolution de nos pratiques. Ce terme d’ordinaire réservé à l’informatique contamine les autres disciplines qui se voient alors affubler du qualificatif « quantitative » (Sociologie quantitative, biologie quantitative, etc). Ainsi l’affluence de données transforment-elle les disciplines et dans un perspective à plus long terme les formations à ces disciplines ? Comment Big Data interagissent-elles avec les plus jeux de données plus modestes souvent plus précis ou comportant plus de variables ? les big Data sont-elles l’avenir et doit-on pour autant oublier les pratiques Small Data.
  • Données et corrélation — les données dont elles dépendantes ou indépendante des disciplines/chercheurs qui les utilisent / créent / récoltes. Elles peuvent avoir une valeur scientifique, économique, épistémologique dans les systèmes complexe mais jusqu’où peut-on se fier aux données, quelles précautions prendre et comment prendre ces précautions. Tout se réduit-il à p < 0,05 ?
  • Abondance de données — il est courant d'être à court de données ou d'en avoir trop peu. Mais en avoir trop peut-il aussi être un obstacle au travail scientifique, affectant à la fois l'imagination et le pouvoir déductif ?
  • Vrai positif, faux positif, vrai négatif, faux négatif — comment démêler le vrai du faux dans les données. La quantité de donnée est-elle un remède à leur imprécision ou incertitude. Comment se prémunir de ces obstacles lorsque les données sont corrélés de manière non linéaire.

Qu'en disent les disciplines?

  • En géographie comme en urbanisme, la question contemporaine des données se caractérise par une incroyable expansion des données disponibles et mobilisables permettant de décrire villes et espaces, du fait de l’avènement des données numériques. L’apparition de bases de données géo-codées de plus en plus nombreuses et souvent de plus en plus en plus spécifiques ont relancé l’intérêt de la discipline et de ses acquis face aux autres sciences – pour autant, cette expansion des données a-t-elle conduit à une expansion similaire de la connaissance ? Notamment, ces disciplines oeuvrent dans des secteurs où la complexité des processus en place, la multiplicité des acteurs, de leurs comportements pas tous forcément réductibles au rationnel, et de leurs interactions génèrent à la fois une multitude d’informations et de signaux et en même temps une grande imprévisibilité. Quel rôle, dans ce contexte, les données, en tant que traceurs des tendances prises, et/ou qu’indicateurs des niveaux des variables impliquées, peuvent- elles avoir dans la compréhension des phénomènes ? 
  • Cette problématique s’applique à l’ensemble des sciences humaines et sociales. En informatique, tout est données mais celles-ci ne prennent sens que par rapport aux traitements qui leur sont appliqués. Sur le plan applicatif, l’OpenData soulève des questions profondes sur le sens même des données que l’on met à disposition. Se pose donc la question de l’interaction entre le sens des données et leur opérationnalisation procédurale. En représentation des connaissances, c’est le statut épistémologique de ces données qui est posé.
  • La donnée, dans les disciplines extrêmement formelles que sont la physique théorique et les mathématiques, ainsi que l'informatique théorique, trouve, dans les dernières théories généralisatrices, telle la théorie de l'information, un statut nouveau et recentré. En effet, dans la continuité des travaux de thermodynamique statistique de Bolztman, Shannon en formulant sa théorie, initialement très pragmatique, a, en réalité, permit de conférer à la donnée, un rôle critique et central. Plus exactement, il a été démontré, en re-visitant la théorie de Shannon, que l'acte le plus coûteux (en termes thermodynamique) de l'Univers, n'est rien d'autre que l'effacement d'une donnée! Cette approche, pourtant hautement théorique et mathématique, s'impose pourtant à l'informatique dans ce qu'elle a de plus pratique, immédiat et quotidien. De la même façon, sans tordre exagérément les concepts et les idées, ce statut augmenté de la donnée rejoint le concept d'événement de Einstein, Cohen-Tannoudji et de Hawking. La question se pose donc des liens entre évènementsobservation et mesure de ces événements et donnée. Peut-il y avoir perception des événements de l'Univers, du niveau macroscopique à l'échelle quantique, sans production de données ? Enfin, ce que l'on nomme entropie et rupture de symétrie trouve-t-elles leurs racines dans ces effacements de données ? 
  • En littérature, en musicologie et en histoire on est amené le plus souvent à utiliser des données du passé inscrites sur des médias variés. Que se soient des ouvrages, des partitions, des enregistrements, ou des toute autre forme de média, leur conditions de conservation et l'absence de numérique sont un challenge scientifique dès lors que l'on parle de données. En outre la très grande variété de données nécessaire, comme ce qui concerne le contexte d'écriture, les commentaires des auteurs, la situation géopolitique et culturelle d'alors, éclairent l'usage des données d'un angle nouveau pour une société devenue numérique. Les analyses synchroniques et diachroniques, l'herméneutique, changent le statut même des données en les contextualisant. Jusqu'où ce contexte doit-il être considéré ? Comme travailler avec des données en quantité quand les moyens même de leur conservation sont un problème en soi ? Dans le cas de la musique, les données elle-même peuvent être des interfaces vers des données originales qui n'existent plus (une partition est une écriture d'une oeuvre sonore dont le son est différent dans les conditions modernes). Comment être certain que les données d'observation issues de l'interface correspondent aux données sonores ou audiovisuelles d'alors bien que lu/vu/entendu avec des technologies modernes ?
  • En biologie ou en éthologie, comment travailler avec des phénomènes difficiles à isoler par nature ? Comment disposer de suffisamment de données pour étudier efficacement des organismes vivants intégrés à des écosystèmes parfois extrêmement étendue et en interaction constante tout en respectant un processus scientifique contraignant ? Quelle est, dans ces cas singuliers, la relation entre la donnée et la construction de la preuve ?
  • Ces quelques exemples ne sont évidemment pas exhaustifs et les contribution en droit, économie, philosophie, chimie, mécanique, statistiques, etc., seraient plus que bienvenues. Nous sommes impatient de découvrir vos contributions pour enrichir un dialogue scientifique ouvert et sérieux qui fait l'essence de Rochebrune depuis toujours.

Si ces thèmes et questions vous interpellent et que vous pensez pouvoir y apporter votre éclairage, vos doutes et vos propres questions, nous attendons votre déclaration d'intention sous la forme d'un résumé sans texte attaché, puis votre communication de 4 à 12 pages, à déposer sur :

https://easychair.org/conferences/?conf=rochebrune2016

Chaque communication sera évaluée par deux membres du comité de programme. Une discussion aura lieu pour décider collégialement de la démarche choisie pour une publication éventuelle chez un éditeur (éditions électroniques Chemins de Traverse) ou une mise en ligne en libre accès. L’objectif de l’échéancier ci-dessous est de pouvoir publier des actes qui seront disponibles pour tous lors des journées.

Echéancier

Intention de communication : 30 septembre 2015 (sur easychair)
Date limite de réception des propositions : 1 décembre 2015 (sur easychair)
Notification de principe : 30 octobre 2015
Limite des préinscription :  30 septembre 2015
Papier complet : 31 décembre 2015
Date limite d’inscription à Rochebrune : 15 décembre 2015 
Edition des pré-actes : début janvier
Journées de Rochebrune : 17 au 23 janvier 2016

4035 - full - Contenu des classeurs

Cookies de suivi acceptés

Ordre de priorité des .INI
Attribute Type Value
0 string 'settings'
1 string 'extension/ezsite/settings'
2 string 'extension/ezfind/settings'
3 string 'extension/ezsiteUtils/settings'
4 string 'siteaccess'
5 string 'extension/ezwebin/settings'
6 string 'settings/override'

Entrées dans $pagedata.SiteParams : SiteBaseURL RootNodeID contact titre_site copyright site_ouvert genererDebug soustitre_site