Guide d’utilisation d’Antidote 10

Guide d’utilisation / Les dictionnaires personnels / Importer dans un dictionnaire personnel / Formats d’importation

Formats d’importation

Introduction

Ce document présente la structure des fichiers d’exportation et d’importation du dictionnaire personnel d’Antidote.

Structure du fichier d’exportation et d’importation

  • format texte
  • chaque ligne doit contenir 1, 2 ou 8 jetons séparés par des tabulations
  • les lignes débutant par « // » sont ignorées sauf exception (voir les sections Langue des mots et Encodage)
  • les lignes vides sont ignorées.

Langue des mots

  • Pour spécifier la langue des mots à importer, on utilise un des trois identificateurs suivants :
    • FR : français
    • EN : anglais
    • ML : multilingue (anglais et français)
  • On peut utiliser ces identificateurs à deux endroits :

    • De façon globale en indiquant entre parenthèses l’identificateur au début du fichier dans le commentaire suivant :

      Nom : NOM_DU_DICO (IDENTIFICATEUR_LANGUE)
    • Pour chaque mot en indiquant comme premier attribut l’identificateur de langue (voir la section Importation à 8 jetons plus bas)
    • Si la langue n’est pas spécifiée selon les méthodes précédentes :
      • Avec un Antidote multilingue, une erreur d’importation surviendra.
      • Avec un Antidote monolingue, la langue par défaut sera la langue de votre Antidote.

Encodage

Antidote tente de deviner l’encodage du fichier d’importation selon le contenu et la plateforme de votre système. Il est aussi possible d’indiquer à Antidote l’encodage sans qu’il ait à le deviner. Avec le commentaire spécial encodage: en début de fichier suivi de l’identificateur de l’encodage.

Les identificateurs pour l’encodage sont les suivants :

  •  mac_roman
  •  iso8859_15
  •  cp1252
  •  utf_8
  •  utf_16_le
  •  utf_16_be

Exemple :

// encodage: utf_8

Importation à un jeton

Si une ligne contient un seul jeton alors le jeton est considéré comme une forme canonique et Antidote infère la catégorie du mot, et (si la catégorie le requiert) la morphologie du mot ou le modèle du verbe. Dans un Antidote multilingue, la langue des mots doit être spécifiée globalement au haut du fichier avec un commentaire spécial (voir la section Langue des mots)

FORME_CANONIQUE __FIN_DE_LIGNE__

Importation à deux jetons

Si une ligne contient deux jetons alors le premier jeton est considéré comme une forme canonique, le deuxième jeton est considéré comme la catégorie. Antidote infère la morphologie du mot ou le modèle du verbe si la catégorie le requiert.

Dans un Antidote multilingue, la langue des mots doit être spécifiée globalement au haut du fichier avec un commentaire spécial (voir la section Langue des mots)

FORME_CANONIQUE __TAB__ CATÉGORIE __FIN_DE_LIGNE__

Importation à 8 jetons

Si une ligne contient huit jetons, les jetons sont considérés dans l’ordre comme suit :

  • Forme canonique
  • Catégorie
  • Champ de flexion 1
  • Champ de flexion 2
  • Champ de flexion 3
  • Champ de flexion 4
  • Attributs séparés par des +
  • Définition

    • pour introduire une nouvelle définition, insérer le caractère « ◊ »
    • pour introduire un nouveau paragraphe, insérer les caractères « \r »
    • pour un mot multilingue, on peut spécifier une définition pour chaque langue. Les définitions sont spécifiées dans le même champ. La définition française doit être précédée du mot-clé |FR| et la définition anglaise du mot-clé |EN|.

      Exemple:

      |FR|Définition de « ABCDEFG »|EN|Definition of “ABCDEFG”

Catégories acceptées

Mots français

  • Acronyme (sigle ou acronyme)
  • Adj (adjectif)
  • Adv (adverbe)
  • Interj (interjection)
  • LocutionLatine (locution latine)
  • Nom (nom commun)
  • NP (nom propre)
  • Verbe (verbe)
  • Pref (préfixe)

Mots anglais

  • Acronym (sigle ou acronyme)
  • Adj (adjectif)
  • Adv (adverbe)
  • Interj (interjection)
  • Noun (nom commun)
  • PN (nom propre)
  • Verb (verbe)

Mots multilingues

  • Acronyme (sigle ou acronyme)
  • Acronym (sigle ou acronyme)
  • NP (nom propre)
  • PN (nom propre)

Champs de flexion

Mots français

  • Acronyme, adjectif, locution latine adjectivale, nom, nom propre
    • Champ de flexion 1 : Masculin singulier
    • Champ de flexion 2 : Masculin pluriel
    • Champ de flexion 3 : Féminin singulier
    • Champ de flexion 4 : Féminin pluriel
  • Verbe
    • Champ de flexion 1 : Modèle du verbe
    • Champ de flexion 2 : À laisser vide
    • Champ de flexion 3 : À laisser vide
    • Champ de flexion 4 : À laisser vide
  • Adverbe, locution latine adverbiale, interjection, préfixe
    • Champ de flexion 1 : À laisser vide
    • Champ de flexion 2 : À laisser vide
    • Champ de flexion 3 : À laisser vide
    • Champ de flexion 4 : À laisser vide

Mots anglais

  • Nom, acronyme
    • Champ de flexion 1 : Singulier
    • Champ de flexion 2 : Pluriel
    • Champ de flexion 3 : À laisser vide
    • Champ de flexion 4 : À laisser vide
  • Adjectif
    • Champ de flexion 1 : Singulier
    • Champ de flexion 2 : Comparatif
    • Champ de flexion 3 : Superlatif
    • Champ de flexion 4 : À laisser vide
  • Verbe
    • Champ de flexion 1 : 3e personne
    • Champ de flexion 2 : Passé
    • Champ de flexion 3 : Participe passé
    • Champ de flexion 4 : Participe présent
  • Adverbe, interjection, nom propre
    • Champ de flexion 1 : À laisser vide
    • Champ de flexion 2 : À laisser vide
    • Champ de flexion 3 : À laisser vide
    • Champ de flexion 4 : À laisser vide

Mots multilingues

  • Acronyme, nom propre
    • Champ de flexion 1 : Masculin singulier
    • Champ de flexion 2 : Masculin pluriel
    • Champ de flexion 3 : Féminin singulier
    • Champ de flexion 4 : Féminin pluriel

Attributs acceptés pour chaque catégorie

Mots français

  • Nom
    • Chose
      •  Entite
      •  Diplome
    • Personne
      •  Fonction
    •  Animal
  • Adjectif
    • Habitant
      •  Langue
  • Interjection
    •  Sensation
    •  Message
    •  Bruit
  • Adverbe
    •  Maniere
    •  Temps
    •  Lieu
  • Locution latine
    •  Adjectif
    •  Adverbe
  • Nom propre
    •  Famille
    •  Prenom
    •  Compagnie
    •  Marque
    • Lieu
      •  VoieDeCirculation
      •  Ville
      •  Ile
      •  Region
      •  CoursDeau
      •  CorpsCeleste
    • Habitant
      •  Langue
    •  TitreOeuvre
    •  Autre
  • Acronyme
    •  Compagnie
    • Chose
      •  NonComptable
      •  Diplome
    • Personne
      •  FonctionSociale
  • Verbe
    • Aucun attribut n’est accepté
    • Modèles acceptés
      •  Aimer
      •  Finir
      •  Courir
      •  Rendre
  • Préfixe
    •  FacultTDU
    •  BesoinTDU
    •  ErreurTDU
    •  FacultTDUReforme
    •  BesoinTDUReforme
    •  ErreurTDUReforme

Mots anglais

  • Nom
    • Thing
      •  Entity
      •  Diploma
    • Person
      •  Profession
    •  Animal
    •  Group
  • Adjectif
    • Demonym
      •  Language
  • Interjection
    •  Emotional
    •  Message
    •  Sound
  • Adverbe
    •  Manner
    •  Time
    •  Place
  • Nom propre
    •  LastName
    •  FirstName
    •  Company
    •  Brand
    • Place
      •  Street
      •  Town
      •  Island
      •  Region
      •  CourseOfWater
      •  CelestialBody
    • Demonym
      •  Language
    •  TitleOfAWork
    •  Other
  • Acronyme
    •  Company
    • Thing
      •  Uncountable
      •  Diploma
    • Person
      •  Profession
  • Verbe
    • Aucun attribut n’est accepté

Mots multilingues

  • Nom propre
    •  Famille, LastName
    •  Prenom, FirstName
    •  Compagnie, Company
    •  Marque, Brand
    • Lieu, Place
      •  VoieDeCirculation, Street
      •  Ville, Town
      •  Ile, Island
      •  Region, Region
      •  CorpsCeleste, CelestialBody
    • Habitant, Demonym
      •  Langue, Language
    •  TitreOeuvre, TitleOfAWork
    •  Autre, Other
  • Acronyme
    •  Compagnie, Company
    • Chose, Thing
      •  NonComptable, Uncountable
      •  Diplome, Diploma
    • Personne, Person
      •  FonctionSociale, Profession