Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique.





télécharger 369.7 Kb.
titreRésumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique.
page6/12
date de publication19.05.2017
taille369.7 Kb.
typeRésumé
e.20-bal.com > économie > Résumé
1   2   3   4   5   6   7   8   9   ...   12

Certaines tentatives ont été faites d’étendre les DOI non seulement aux articles, mais aussi aux « données utiles à la recherche », ainsi de la Bibliothèque nationale allemande qui a développé pour ces types de données un résolveur d’URN.

L’Info-URI scheme82, conçu par des représentants du monde des bibliothèques et des éditeurs commerciaux, a pour intérêt d’attribuer des identifiants à des informations non seulement numériques, mais également physiques ou conceptuelles. Un info-URI peut ainsi être attribué à un concept terminologique, à un auteur, à une ressource numérique. Les noms de domaine info-URI sont attribués et enregistrés de façon centralisée dans une base maintenue par l’OCLC. Pour l’instant cependant il n’y a qu’un prototype de résolveur d’infoURI, ce qui constitue un obstacle majeur pour mettre au point un modèle commun d’identifiant.
La création de services de résolveurs de liens est donc une composante clé des futures infrastructures de recherche afin de garantir l’accès pérenne aux ressources numériques qu’elles contiennent et la création de liens entre ces ressources et d’autres types de données. Il s’agit d’harmoniser les approches à l’œuvre dans les différentes disciplines et d’enrayer la multiplication des systèmes d’identification et de résolution de liens spécifiques à tel ou tel domaine.

Elle permettrait également de gérer la question des droits d’accès différenciés attachés aux ressources et de prendre en compte le contexte de l’utilisateur : le JISC suggère d’intégrer les mécanismes d’openlink aux archives ouvertes83 et d’utiliser le protocole OAI-PMH pour permettre aux résolveurs d’atteindre les URL dans une base de données internationale, afin de déterminer à quelle version l’usager a le droit d’accéder selon les abonnements de son institution et de l’orienter au mieux.
Développer des services novateurs et à forte valeur ajoutée grâce aux systèmes de citation analysis

Les mécanismes de citation analysis peuvent permettre le développement de nouveaux services analogues à ceux que fournissent déjà les éditeurs commerciaux et qui fondent l’attractivité de leurs bases de données. Il s’agit de services à forte valeur ajoutée pour les publications scientifiques.

Les citations sont généralement encodées dans une section bibliographique à la fin de l’article. Parfois elles incluent un lien à l’article, un DOI. Il devrait être possible de naviguer dans une base de donnée en suivant les liens inclus sous forme de citation. Cette évolution a des incidences sur les services offerts à l’usager mais elle peut aussi modifier la façon d’évaluer les publications et l’activité des chercheurs. Un certain nombre de services, comme le calcul de l’impact factor84, ont été fondés sur l’identification des citations et leur encodage dans des liens résolvables. La technique de la citation analysis permet de trouver, décoder et interpréter les citations dans les articles. Cette méthode a été utilisée par le Web of Science mais aussi plus récemment dans le contexte des archives ouvertes, à l’initiative d’ArXiv. La Cornell University  a ainsi travaillé à une API permettant d’accéder directement à la liste des articles cités, et aux informations bibliographiques sur ces articles. Si ce genre de services connexes, qui ont une part déterminante dans le succès de bases comme le Web of Science85, se développent dans les archives ouvertes, ils ne se conforment pas à des standards et la normalisation des procédures est importante de ce point de vue-là.

De façon plus novatrice, de tels services pourraient à l’avenir servir à lier entre elles les archives, par exemple celle où se trouve le preprint et celle où se trouve l’article publié. Ces avancées supposent de s’appuyer sur des standards existants, comme OAI-PMH, les web services de recherche et de dépôt et les mécanismes d’openlink.

Un autre moyen de lier entre elles les archives et les ressources qu’elles contiennent réside dans la mise en place de services terminologiques.
Les services d’autorité et de terminologie

Les terminologies imposent aux ressources une organisation conceptuelle similaire et les rendent davantage interopérables. Les services terminologiques sont un ensemble de services qui proposent des vocabulaires spécifiques (autorités, thesauri, ontologies, listes contrôlées de termes), en incluant les concepts qui les fondent et les relations qui les unissent. Les services terminologiques s’avèrent ainsi très utiles pour interconnecter des archives institutionnelles qui n’utilisent pas les mêmes terminologies pour le dépôt. Dans les archives institutionnelles, les terminologies peuvent être harmonisées au moment du dépôt. Les services terminologiques peuvent aussi servir à retravailler des données, à les normaliser ou à les enrichir après leur création. Ils peuvent contribuer à étendre les fonctionnalités de recherche et de requête proposées par les plateformes et les moteurs spécialisés.

Les services terminologiques ont une autre finalité, celle de synchroniser des terminologies unifiées. Des terminologies comme les autorités noms doivent ainsi être constamment mises à jour. Les travaux du W3C devraient conduire à une standardisation des approches et des accès aux services de terminologie. L’unification des protocoles d’accès aux terminologies concerne, au-delà des archives ouvertes, les banques de données pour la recherche, les CRIS, la presse en ligne, etc.
Toutes ces tentatives d’amélioration des systèmes de mise en relation entre les ressources tendent in fine à permettre des interactions avec le contenu des archives et des requêtes à distance sur les ressources déposées. Cette démarche conduit à réfléchir à des mécanismes de synchronisation des contenus entre différentes archives, voire, à terme, à la possibilité d’échanger non seulement les données décrivant les ressources, mais les ressources elles-mêmes86.
Transferts d’objets ou synchronisation du contenu de plusieurs archives
Les études menées dans le cadre de DRIVER87 identifient des problèmes récurrents qui empêchent un accès optimal aux contenus des archives et aux contenus des ressources :

Beaucoup de fournisseurs de service veulent accéder aux ressources numériques elles-mêmes, notamment pour construire un index à partir du plein texte des publications scientifiques. Or dans les archives institutionnelles, il n’est pas possible à un moteur de recherche de déterminer si la ressource décrite est accessible en plein texte ou pas. De même, si certains liens dans les métadonnées pointent vers la ressource numérique, dans beaucoup de cas il y a plusieurs identifiants dans la notice qui pointent vers différentes versions, ou vers une partie de la ressource, pour des usages différents, et souvent les URL contenues dans les métadonnées pointent vers une page où se trouvent des liens vers les différentes versions de la ressource. Or pour indexer le contenu d’un article, il est nécessaire que puisse être identifiée de façon univoque l’URL qui pointe vers l’article lui-même. Le réseau DARE recommande, pour pallier ce problème, que les fournisseurs de données définissent des sets OAI qui distinguent les notices qui sont accompagnées d’une ressource numérique de celles qui décrivent une ressource physique.

D’autres pistes visent à étendre les possibilités de manipulation des ressources contenues dans les archives en transférant le contenu d’une archive à un autre. Des tentatives ont été faites pour étendre l’usage du protocole OAI-PMH au transfert des ressources elles-mêmes.

Le protocole OAI-PMH a été conçu à l’origine pour échanger des métadonnées, et non pour permettre l’accès aux ressources numériques elles-mêmes. Mais de nombreuses initiatives ont été lancées pour étendre les usages de ce protocole de façon à ce que les fournisseurs de services puissent interagir directement avec les ressources numériques décrites par les métadonnées et localisées dans les archives institutionnelles. OA-X88 est une extension du protocole OAI-PMH issue d’un projet néerlandais, qui vise à étendre le protocole pour y inclure des requêtes qui permettent de moissonner des ressources numériques elles-mêmes (une requête GetObject équivalent à la Getrecord, et PutObject pour ajouter une ressource à l’archive). Cette innovation permet de transférer non seulement des métadonnées, mais également les ressources numériques elles-mêmes. OAI-ORE devrait également permettre à terme des interactions avec le contenu des ressources.

Cette possibilité technique trouverait de nombreuses applications. Par exemple, le NDIIPP aux EU étudie des mécanismes pour permettre le transfert de ressources numériques dans d’autres archives afin de garantir leur conservation pérenne.

Ainsi, au-delà des fonctionnalités basiques de dépôt et de recherche, les archives ouvertes pourraient-elles offrir des services bien plus riches afin de valoriser les publications. Le développement de l’interopérabilité non seulement entre les différentes archives ouvertes, mais plus largement entre ces archives et d’autres applications, est un préalable à une meilleure valorisation du contenu des publications. De façon générale, on tend vers une description plus fine de la structure interne des publications pour permettre des usages inédits de leur contenu. Les efforts de modélisation visent à rendre compte de l’évolution des formes et des structures de la publication scientifique.

L’édition électronique conduit en effet à une mutation des formes prises par la publication électronique. Certaines initiatives de numérisation de corpus dont les SCD sont parties prenantes d’un processus d’expérimentation de nouvelles pratiques d’écriture scientifique, notamment dans le domaine des SHS.
Numérisation, et innovations intellectuelles et formelles concernant les publications en SHS

Certaines entreprises de numérisation menées par les SCD contribuent à valoriser les publications scientifiques et à offrir aux chercheurs la possibilité d’expérimenter de nouvelles pratiques d’écriture collaborative. Ainsi un partenariat entre l’université et les bibliothèques municipales de Rouen a-t-il permis la numérisation, l’édition critique et l’étude des manuscrits de Madame Bovary89. L’édition finale et critique est le fruit d’un travail collaboratif entre les chercheurs et le public des bibliothèques universitaires et municipales. Les bibliothèques accompagnent ainsi un mouvement de mise à disposition de manuscrits désormais disponibles pour des usages variés. La numérisation des manuscrits de Flaubert, accompagnés de photos et de notes critiques, est d’une part une entreprise de valorisation patrimoniale à destination du grand public. Elle est d’autre part une publication scientifique, une édition critique que des spécialistes académiques ont validé. Enfin, elle permet de diffuser et de rendre disponible un matériau, une source pour des usages futurs. Elle est ainsi assez révélatrice des mutations que connaît la publication scientifique : ici la frontière entre donnée utiles à la recherche et produit de la recherche s’estompe, et une production scientifique peut constituer le matériau de base d’une recherche ultérieure. Elle peut en définitive faire l’objet d’usages et d’appropriations démultipliés.
Les perspectives tracées par l’évolution vers le Web sémantique offrent d’autres potentialités d’enrichissement des données contenues dans les publications scientifiques par leur mise en relation avec d’autres données, produites ou non par la recherche académique.

Vers le Web sémantique 

Les perspectives d’évolution vers le Web sémantique tracent les contours d’une valorisation des publications scientifiques sans commune mesure. La possible exploitation des métadonnées TEF relatives aux thèses françaises dans le cadre du Web sémantique offre une illustration intéressante des opportunités et des questionnements que fait surgir le mouvement initié par le W3C. On s’appuiera sur la réflexion de Yann Nicolas90 à partir des travaux du groupe AFNOR auxquels il participe.

Le principe du Web sémantique est de structurer les métadonnées relatives à l’ensemble des ressources en ligne ou simplement décrites sur le Web selon un modèle commun, le modèle RDF, qui associe un sujet, un prédicat et une valeur attribuée à ce prédicat ( Tel individu / est l’auteur de / la thèse portant tel identifiant ). Ces énoncés, interprétables par les robots et moteurs de recherche, leur permettraient d’agréger les descriptions RDF dispersées à travers le web mais parlant de la même chose (par exemple toutes les informations présentes sur le Web se rapportant à l’auteur de la thèse). C’est l’usage d’identifiants univoques, désignant la même personne ou la même ressource, les URI, qui permettrait de relier entre elles ces informations (le DOI d’un article peut par exemple servir de base pour former un URI, de même qu’une notice d’autorité issue de la base Sudoc peut servir de base pour former un URI pour identifier un auteur).

Dans ce système de représentation de la connaissance, les métadonnées structurées qui décrivent les thèses françaises pourraient s’insérer dans un vaste ensemble de métadonnées disponibles sur le Web mais ne provenant pas du seul contexte documentaire. Ces mises en relation permettraient d’accroître considérablement l’exploitation des informations contenues dans les thèses si des énoncés RDF viennent décrire plus finement encore le contenu même de la thèse. L’intérêt du Web sémantique serait de relier les informations scientifiques à un ensemble d’informations produites par d’autres communautés professionnelles, et notamment à des données provenant des musées, des archives, de Wikipedia, des sociétés de gestion de droit, du monde commercial et industriel.
Cette exploitation inédite des données relatives aux publications scientifiques ou des données contenues dans les publications scientifiques (selon le degré de granularité auquel descendent les descriptions) requiert de la part du monde des bibliothécaires un travail de modélisation et de structuration croissante des données. Ce travail dans le cas des thèses françaises a été effectué de façon approfondie par le groupe AFNOR en charge de définir le jeu de métadonnées TEF (thèses électroniques françaises). La définition du vocabulaire TEF a été notamment l’occasion d’expliciter les différents sens de la notion de thèse sur la base du modèle des FRBR selon qu’on parle de la thèse comme œuvre au sens des FRBR (« la thèse a pour auteur Michel Ciron ou la thèse parle du spectacle vivant »), de la thèse comme expression (« telle version d’une thèse a 150 pages »), de partie de manifestation (« le fichier de la thèse est au format PDF »), etc. Ce modèle conceptuel doit être affiné et formalisé par l’écriture d’un schéma RDF-s/OWL de TEF, qui permettrait notamment de préciser les d’exprimer les relations entre le vocabulaire TEF et les vocabulaires standards comme le Dublin Core ou les FRBR.
Les perspectives offertes par le développement des ontologies OWL sont multiples. Les métadonnées décrivant les TEF pourraient à terme bénéficier du travail de normalisation et de modélisation effectué par d’autres communautés, par exemple les communautés juridiques si elles font progresser les ontologies portant notamment sur la propriété intellectuelle. Quand les vocabulaires exprimant des droits auront achevé leur mue vers le web sémantique, on pourra dire en RDF : l’auteur X autorise la diffusion de la thèse Y, le partenaire Z refuse la diffusion de la thèse Y. A terme les technologies du web sémantique permettront d’en déduire des informations sur le caractère diffusable ou non de la thèse en couplant les informations ainsi disponibles. L’état juridique final de la thèse se déduirait de ces différentes contraintes exprimées en RDF.

De la même manière, la notion de « confiance » disponible dans les vocabulaires du Web sémantique pourrait permettre de rendre compte des notions d’évaluation, de certification, de validation inhérentes aux publications scientifiques et aux thèses qui font de la  science « un réseau de réseaux basés sur la confiance »
1   2   3   4   5   6   7   8   9   ...   12

similaire:

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconRésumé : Ce mémoire traite de la valorisation des publications scientifiques...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconRésumé L’environnement national et international de la santé, de...
«équipes de recherche labélisées». Développer les interactions avec une recherche amont et accélérer le transfert des résultats de...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconAdresse complète de l’établissement de mise en œuvre du projet
«Dans un environnement de plus en plus concurrentiel, le renforcement de la compétitivité des entreprises, leur développement et...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconL’impact des Systèmes d’Information Géographique (sig) sur les organisations de l’archéologie
«On trouve donc dans les pratiques scientifiques un noyau dur, celui des contenus scientifiques entouré d’un environnement social,...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconRelations
«Relations» de mars 02 a été diffusée dans chaque établissement par courrier électronique; les professeurs qui n’en auraient pas...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconRésumé Le déploiement du libre accès est intimement lié au contexte...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. icon1. Zoom sur Bilan des Traam 2013-2014
«Utilisation des terminaux mobiles dans l'enseignement et dans l’accompagnement des élèves» (voir par exemple l'académie de Dijon...

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. icon1- sciences économiques et sociales – Principes fondamentaux de l’économie...
«l’affectation consiste à proposer une place dans un établissement en tenant compte des vœux exprimés par la famille»

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconPublications dans des revues scientifiques à comité de lecture
«tep et radiothérapie». Cancer/Radiothérapie, Volume 13, Issue 4, July 2009, Pages 313-317

Résumé : Ce mémoire traite de la valorisation des publications scientifiques de leur établissement par les scd dans un environnement essentiellement numérique. iconGuy : Quand on affirme que les Roms ont dans leur culture le vol,...
«carrière» : certains travaillent dans la construction ou l'agriculture; ils font des allers-retours dans leur périple migratoire....






Tous droits réservés. Copyright © 2016
contacts
e.20-bal.com