40
OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités à rechercher ? (signets, table des matières, liens hypertextes) manipulation sur un document word utilisation d’une feuille de style (.dot) conversion d’un document en pdf Création de documents numériques D. Fournier – 15 novembre 2005

OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Embed Size (px)

Citation preview

Page 1: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

OBJECTIFS de la ½ journée :

le document numérique (mémoires, thèses, rapports, …)

pourquoi une diffusion en format pdf ? vs doc et XML

quelles fonctionnalités à rechercher ?(signets, table des matières, liens hypertextes)

manipulation sur un document word utilisation d’une feuille de style (.dot)conversion d’un document en pdf

création d’une feuille de style + barre d’outils

Création de documents numériques

D. Fournier – 15 novembre 2005

Page 2: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Caractéristiques d’un document numérique (1)

- intégration complète de différents médias (texte, son, image, animation, …) : multimedia

- interactivité entre l’utilisateur et le document, s'adaptant au contexte d'utilisation, à une lecture

non linéaire : hypermedia

- le contenu peut se retrouver physiquement dans des endroits différents : distribué et

collectif

- réalisation nécessitant des techniques et outils particuliers pour acquisition, stockage, visualisation, diffusion, …

- pérennité incertaine et archivage complexe

- peut être un produit dynamique, conçu pour intégrer les mises à jour du domaine d’expertise

Page 3: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Caractéristiques d’un document numérique (2)

Chartron, 2000, normes et standards: documents numériques: intro générale http://www.ccr.jussieu.fr/urfist/presse/standard/coursintro.htm

Toutes ces caractéristiques font influer sur les processus de standardisation / normalisaton à l'oeuvre pour le document numérique

la production numérique des documents permet de penser à la source

aux usages potentiels de ces documents et d'y associer les composants nécessaires.

Les "métadonnées" (données sur les données) doivent permettre un usage pour une finalité donnée dans un contexte donné.

L'accès au contenu pour l'utilisateur, le référencement pour un professionnel, la gestion des droits pour un éditeur...

Le document numérique peut être porteur de l'ensemble de ces intérêts, réglés auparavant, pour le document papier, selon des modalités différentes et souvent disjointes.

Page 4: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

La production de documents numériques à Agropolis

Les mémoires d’étudiants (Pôle Agro, …)Les Thèses (Ecoles doctorales, …)Les rapports (internes, externes, …)

Services d’édition (Cirad, IAMM, …)

documents « texte »

à noter la série Master of Science de l’IAMM

Page 5: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Un « bon » document numérique

Thèse de Condom, 2000 (240 pages) avec signets, http://www.inra.fr/Internet/Departements/EA/fichier_these/CONDOM.pdf

Thèse en ligne de De Mezzo, 2004 (150 pages)avec signets et table matière cliquable, http://www.montpellier.cemagref.fr/doc/publications/theses/ft/benoit-demezzo.pdf

Page 6: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Un « mauvais » document numérique

Une thèse en ligne (Devez, 2004, 269 p., sommaire p.8)http://tel.ccsd.cnrs.fr/documents/archives0/00/00/64/97/tel-00006497-00/tel-00006497.pdf

Le Projet de pôle de recherche et d’enseignement supérieur agronomiques (41 pages, absence de table de matière)http://www.agropolis.fr/pole-ens-agro/rapetap/03-Synthese.pdf

cas de la série Master of Science

Page 7: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Nécessité d’uniformiser le traitement des documents

 Imposer une norme dans la présentation des documents. Afin de faciliter le traitement du document, il s'est révélé nécessaire de normaliser le document à sa source, c'est à dire au moment  de la rédaction. L’étudiant, le doctorant, le chercheur est invité à utiliser des modèles de document.

Les modèles de document (ou feuille de style) permettent de concevoir des documents structurés dont la présentation est normalisée et qui contiennent des informations hiérarchisées.

Ce système facilite les opérations de conversion des thèses vers d'autres formats (SGML ou PDF...). Des modèles de documents spécifiques aux thèses ont été élaborés à partir de logiciels de traitement de texte.  Les formats les plus utilisés lors de la rédaction des documents sont: LaTeX, Postscript, Word, Wordperfect.

 Normalisation du format d'encodage des documents.

PDF (Portable Document Format):

SGML (Standart Generalized Markup Language)  a  été retenu dans le cadre de nombreux projets. SGML est une norme d'encodage des documents, depuis 1986, qui permet l'échange de données électroniques.

HTML (Hypertext Markup Language)

XML (Markup Language) sont aussi fréquement utilisés.

Page 8: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le cas des thèsescirculaire MENESR du 29 mars 2005 http://www.sup.adc.education.fr/bib/Acti/These/circulaire.rtf

– Avant la soutenance

• La structuration de la thèse : Chaque établissement, en relation avec ses Ecoles Doctorales, est libre de préconiser à ses doctorants l'usage d'outils de structuration des thèses et de feuilles de style

– A l'issue de la soutenance,

• le président de l'établissement, sur proposition du jury, autorise la diffusion de la thèse

• Celle-ci étant non seulement considérée comme un document administratif mais aussi comme un document soumis aux règles de la propriété intellectuelle

• le docteur devra autoriser de façon explicite la diffusion de son travail.

- Après la soutenance

– La conversion et la diffusion des thèses

Chaque établissement choisit le ou les format(s) dans le(s)quel(s) seront converties les thèses pour archivage

(XML, PDF) et pour diffusion (HTML, PDF).

– Le signalement des thèses dans le Sudoc, les catalogues des établissements …

– L'archivage des thèses

réalisé par les établissements + copie au CINES

Page 9: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le cas des mémoires d’étudiants

Sup’AGRO

• AGRO.M

• CNEARC

• ENGREF

• SIARC

Pôle Agropolis International

• Cemagref

• Cirad

• IAMM

• INRA

3ème cercle

• IRD

• Cnrs

Feuille de style

Feuille de style

+ projet cyberthèses (INRA Avignon)le point de départ est un document traitement de texte, qui contient ses illustrations ou avec des illustrations extérieures (ce qui est conseillé). Ensuite, ce document est converti en format XML, DTD TEILite, ce qui devient le document de référence. Avec ce document de référence, différents produits dérivés seront obtenus, notamment des métadonnées, des versions HTML et PDF, de même qu'une version pour impression destinées au module de publication.

+ une DTD au Cnearc ?

Page 10: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Intérêts d’une feuille de style

Permet d'identifier ou de marquer les différents éléments syntaxiques d'un texte. Peu importe le logiciel utilisé pour la rédaction, les éléments que l'on trouve dans la feuille de style sont les mêmes, c'est un outil suffisamment générique pour être utilisé quel que soit le domaine de recherche.

Le marquage des éléments syntaxiques d’un document peut sembler inutile… mais présente de nombreux intérêts.la manipulation et la mise en page du document seront plus rapides et plus efficaces (grâce à l'identification des éléments syntaxiques)

Elle permet ainsi de produire des documents plus homogènes.

un premier pas vers la structuration du document une aide non négligeable pour la rédaction.

Page 11: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Les garanties du format pdf

 Des logiciels lecteurs de PDF sont disponibles gratuitement pour la quasi totalité des plates-

formes informatiques, ce qui en fait un format lisible presque partout sans problème; c'est une caractéristique qui n'est partagée que par HTML et par le format ASCII.

>>> Structuration a minima pour diffuser vite option retenue par ParisTech, TEL, …

Largement diffusé aujourd'hui par une société reconnue, Adobe, il semble qu'on

puisse raisonnablement se fier à sa  pérennité.

Le format PDF permet de conserver l’apparence du document tel qu’il est présenté sur support papier. Le format PDF permet donc de diffuser des documents tout en conservant la mise en page et le format d’origine.

Il permet également d'intégrer des éléments multimédia: photographies, graphiques, sons...

Ce format permet de mettre en oeuvre une protection des fichiers : contre la modification, contre l'impression, contre le copier/coller

Page 12: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Vers une harmonisation et une généralisation des pratiques

Pour un document pdfSignetsTable de matières cliquableLiens hypertextes

Pour un document wordexplorateur de documentstable des matièresliens hypertextes

Page 13: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Préparation du document (Word)

1 - stylage du documentutilisation de la feuille de style (normal.dot)modification des styles proposés (hiérarchisation, police, …)

3 - paramétrage des options pour conversion en pdf

4 - utilisation de feuilles de style + complexespour document structuré, conversion XMLmême démarche pour powerpoint (titre)

2 – fonctionnalités génération de la table des matières, (+ liste des figures, liste des annexes, …) et création de liens hypertextes (URL, signets)

Page 14: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Stylage d’un document

1 - Téléchargement du fichier document_TP.doc

http://www.montpellier.inra.fr/documentation/adresses_utiles.htm Clic droit enregistrer la cible du lien vers…

2 - Stylage du document Format Style

utilisation de la feuille de style (normal.dot) : (mettre en surbrillance le titre et appliquer le style voulu)

Titre 1

Titre 2

Titre 3

Page 15: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Modification des styles

Format Style… Modifier… FormatPoliceParagrapheBordureNumérotation

1 – TITRE 1

1-1 Titre 2

1.1.1 Titre 3

Page 16: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Création de nouveaux styles: exemple ANNEXE

Numérotation automatique des annexes Format > Style > Modifier >Annexe

NumérotationNumérosPersonnaliser

Format Style… Nouveau… Annexe

Page 17: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

L’explorateur de documents (Word)

Affichage … Explorateur de documents

Page 18: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Création de la table des matières

NB: se placer au début du document !

InsertionTables et index … Table des matières

OK

NB: ne pas oublier d’intégrer les annexes ! (cf. Options …)

Page 19: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Création de la liste des annexes et/ou des figures

NB: se placer avant les annexes !

InsertionTables et index … Table des illustrations

Options …Construire la table à partir de :Style Annexe

Page 20: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Création de liens dans le texte

Insertion … Signets… Figure1

AjouterAnnexe1

Annexe2

Insertion … Liens hypertextes Signet …Figure1Annexe1Annexe2

Page 21: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

La conversion doc pdf

Acrobat Convertir en pdf

Modifier les options de conversion

Protection du fichier pdfMot de passe, Droits (copie, impression)

Signets

Titre1 XTitre2 XTitre3 X

Annexe X

AcrobatConvertir en pdf

Page 22: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le résultat obtenu Document_TP.pdf

Identique au document initial

Signets permettant une navigation dans le texte

Table des matières cliquable

Liens hypertextes

Page 23: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Créer une nouvelle feuille de style

Objectif: utiliser dans un autre document les modifications de styles réalisées sur le document document_TP.doc

Dans WordFichierNouveauCréer un nouveau Modèle

Créer (ou modifier) les styles que vous voulez utiliser

Sauvegarder le modèleFichier Enregistrer sous…TP_INRA.dot

Page 24: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Créer une nouvelle feuille de

style avec barre d’outils (1) Dans Word (TP_INRA.dot)EditionBarre d’outilsPersonnaliserNouvelle…

Positionner sur la barre les styles du modèleCommandesStyles (Clic droit pour modifier l’intitulé)

Page 25: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Créer une nouvelle feuille de

style avec barre d’outils (2)

Possibilité de classer les styles dans des menus déroulants Nouveau Menu

Possibilité d’insérer un logo à bricoler à partir de Formes automatiques,puis clic droit Editeur de boutons

Page 26: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Utiliser une feuille de style

Les modèles sont enregistrés dans le répertoireOutils > Options > Dossiers par défaut > Modèles utilisateursY copier les modèles TP_INRA.dot

Dans WordFichierNouveauSélectionner le modèle que vous souhaitez utiliser TP_INRA.dotCréer un nouveau Document

Page 27: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Utiliser une feuille de styleavec barre d’outils

Dans WordOutilsModèles et complémentsAjouterSélectionner le modèle que vous souhaitez utiliser TP_INRA.dotOrganiser…

Étape 1 :

Sélectionner tous les styles du document ouvert et supprimer

(certains ne peuvent pas être supprimés)

Etape 2 :

Fermer le fichier

Ouvrir le fichier en affichant les styles du modèle TP_INRA.dot

Sélectionner tous les styles et copier.

Etape 3 : Fermer

Page 28: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

avec la feuille de style TP_INRA.dot

Page 29: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Appliquer une feuille de style à un document existant

Ouvrir le document auquel on veut appliquer le modèleAffichage > Plan Copier le texte ( Edition > Sélectionner tout et Copier)

FichierNouveauSélectionner le modèle que vous souhaitez utiliser rapport_Agropolis.dot

Appliquer les différents styles au documentSi le document initial utilisait déjà une feuille de style, la feuille de style s’applique automatiquement

Page 30: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

avec la feuille de style

rapport_Agropolis.dot

Page 31: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le projet Cyberthèse

La plateforme Cyberdocs permet de structurer des documents issus de traitements de texte et de les publier sur internet, à l'aide de la norme XML (Extensible Markup Language) et de la DTD TEI Lite (text encoding initiative)

Elle est aujourd'hui principalement utilisée comme nouvelle plateforme de traitement et de diffusion des thèses dans le cadre du projet CyberThèses, un programme francophone d'archivage et de diffusion électronique des thèses, qui regroupe aujourd'hui de nombreuses institutions francophones ou non à travers le monde. La nouvelle appellation Cyberdocs signifie que la plate forme d'édition électronique peut traiter tout document structuré qu'il soit conforme ou non à la DTD TEI Lite.

Page 32: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

La feuille de style « Lyon 2 » utilisée pour la

diffusion électronique des thèses Mise en forme du fichier électronique de la thèse les menus permettent de « styler » les diverses parties du texte en les surlignant et en attribuant la dénomination souhaitée

aide à la structuration intellectuelleFeuille de style : http://demeter.univ-lyon2.fr:8080/sdx/theses/fds.shtm

Conversion de fichier et mise en ligne à l’aide du logiciel SPARTE (Système de Production et d’ARchivage de Thèses Électroniques).

Une thèse en format XML pour la pérennité et l’archivage

Contenu de la thèse + ressources

Les métadonnéesUne version HTML pour la diffusionUne notice dans le catalogue Sudoc

Page 34: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

La feuille de style ENSSIB

http://www.enssib.fr/bibliotheque/documents/styles/manuel_style.pdf

Feuille de style comprenant 16 sections, avec entête et pied de pagedont 5 parties pré-définies

Page 35: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Autres types de fichiers pdf

Diaporama powerpoint : utiliser des diapositives avec TitreAcrobat > Modifier les options de conversionOffice: fonction powerpoint > créer des signets

Page 36: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le format pdf

Créé en 1992, le format PDF (Portable Document File) a peu à peu évolué pour remplir deux rôles très distincts : - homogénéiser les formats pré-presse de la chaîne graphique (imprimeurs) - faciliter la diffusion de documents bureautiques propriétaires sur le Web.

Présentation de supports originaux : Les fichiers Adobe PDF sont fidèles aux originaux et se prêtent parfaitement à l'archivage électronique et à la protection des documents.

Format Universel : Le logiciel gratuit Adobe Reader permet d'ouvrir des documents Adobe PDF sur n'importe quel système, indépendamment de la plate-forme logicielle, de l'application native ou des polices utilisées.

Convivialité : Les fichiers Adobe PDF sont beaucoup plus polyvalents et fonctionnels que ceux créés avec des applications non Adobe : polices incorporées, informations sur les profils colorimétriques pour un meilleur rendu des couleurs quels que soient les systèmes, et balises permettant de réagencer le contenu des

documents en fonction de l'affichage.Sécurisation de l'échange de documents : Grâce à Adobe Acrobat® 7.0 ou Adobe LiveCycle™, vous pouvez protéger vos fichiers PDF par un mot de passe pour empêcher leur consultation ou leur modification par des utilisateurs non autorisés tout en autorisant les personnes habilitées à les réviser à l'aide d'outils d'annotation intuitifs.

Documents indexables : Les fichiers PDF permettent de rechercher des termes figurant aussi bien dans le corps du texte que dans les annotations, les signets et les champs de données.

Page 37: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Le logiciel Acrobat

Acrobat reader : logiciel gratuitpermet de visualiser un document pdftéléchargeable sur de nombreux sites

Acrobat writer : logiciel payant s’inscrire pour pouvoir l’utiliser sur le réseau INRA AGRO.Mpermet de créer des fichiers en format pdf

(paramètrage de macros dans word pour conversion)permet de protéger un document (mot de passe, lecture, impression)permet d’apporter (et de gérer) des commentaires sur un document permet d’introduire des liens et des signets dans un document pdf

NB: il n’est pas possible de modifier de façon importante le contenu d’un document pdfToutes les miodifications devront être faites avec le document initial (avant conversion)

Page 38: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Quelques fonctionnalités d’Acrobat Writer (1)

• Insertion de commentaires sur un document

surlignage

note, Texte à main levée, tampon

• Gestion des commentairesaffichage du navigateur

Ou Fenêtre Commentaires

Page 39: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Quelques fonctionnalités d’Acrobat Writer (2)

• Des possibilités de recherche dans le texte

ou Edition Rechercher…

• Des possibilités de copier du texte pour le coller ailleurs sélectionner le texte puis Ctrl C (et Ctrl V dans word…)

• Des possibilités limitées pour retoucher du texte

(sur une seule ligne)

Page 40: OBJECTIFS de la ½ journée : le document numérique (mémoires, thèses, rapports, …) pourquoi une diffusion en format pdf ? vs doc et XML quelles fonctionnalités

Quelques fonctionnalités d’Acrobat Writer (3)

• Des possibilités de naviguer entre les signetsSignets posés manuellement (Signet > nouveau signet)Signets générés automatiquement (feuille de style dans Word)

• Des possibilités pour insérer des liens hypertextes (cliquables)