MOTS_clefs
géographie linguistique
VARIATION/VARIABILITE
FRAGMENTATION/AIRES/GROUPES
DICTIONNAIRES DE VARIABLES (tables de dponnée)
classification exploratoire
visualisation des classes distributionnelles
L'objectif du répertoire ATLAS est de donner à voir, aussi bien pour des linguistes que des non linguistes, la fragmentation dialectale d'une langue historique dans la totalité de ses composantes, telle que l'occitan aquitain, central ou méditterranéen.
-ViSU_listes
VISU_bases de données relationnelles
VISU_cartes
VISU_bases de données SON_texte_annoté
Cartes1
Cartes2
Cartes3
Lalanne
Carnets
Albums
Occiton2

Le but est de rassembler et de réutiliser, dans une base de données générales, l'ensemble des données antérieures, actuelles et à venir, sous des formats d'atlas linguistiques sonores, essentiellement pour l'occitan, le catalan et le basque ; il fallait, pour cela, créer une méthode générique, applicable à la généralité des cas, et non au seul cas occitan, centre réel de nos préoccupations locales (Fossat-Peytavi 1986)
Code de l'action clé : DELTA
lien aux programmes internationaux : THESOC (Thesaurus Occitan)
ARTISAN DE LA MÉTHODE DELTA
Société Image : Jean-Marc Peytavi et Choeb Zafar (1996-1993) ; développements (1993-1997)
OBJECTIF
Il s'agit de vaincre des réticences qui se sont formulées à diverses reprises sur l'appareil même de la dialectologie, ses méthodes, ses concepts, son appareil, son dispositif, ses retombées
* réutilisabilité des données : toutes les données (cartes-données; carnets; résultats d'analyses) sont réutilisables par tous
* réticences sur le caractère ésotérique de la terminologie dialectale : elles tombent devant la pratique concrète par l'utilisateur, en session de manipulation de données transcrites, sonorisables, manipulables
* réticences sur la nature même des objectifs : des mélectures des supports utilisés, aboutissent à une représentation dangereuse de la langue émiettée
* réticences sur le caractère lacunaire de l'approche dialectale et géolinguistique, au regard d'une dialectologie pragmatique, traitant les aspects énonciatifs de la parole occitane : on renvoie sur ce point aux supports textes et dictionnaire pragmatique.
On conçoit deux modes d'utilisation de la méthode drawcarte.base_atlas
1° elle peut être utilisée comme un outil de la connaissance avancée (module numérique)
2° ellepeut aussi être utilisée comme instrument adjuvant de vérification de connaissances amorcées sur textes et dictionnaires, en rapport avec les théories de l'amorçage et de la récumération en psychologie cognitive (module non numérique).
MATERIAUX, DATA (drawcarte/base_atlas. DATA)
Chaque équipe d'application constitue ou sélectionne un data au format 4D.5 ou ultérieur.
* GASCON (maquettes, prototypes, produits finis)
ALG7 atlas numérique électronique © clid JL Fossat 1993
ALG8 base de connaissances de l'atlas linguistique occitan électronique
- module gascon : ALG 1, 2, 3 données © Jean SEGUY ALG : data des carnets
début de l'opération : 1996 ; échéance : 1998 (transsfert au THESOC, par étapes : 1o mai 1997 2o décembre 1998 FIN)
* PREVISIONS (1998) dans le cadre des opérations de Thesaurus Occitan
- module languedocien
- module occitan alpin
Coordinateur Général THESOC : J.-Ph. Dalbéra
Coordinateur Régional THESOC : Jean Azéma
Cadre général :
Opération du Thesaurus Européen (CEE DG XXIII, Langues et cultures minoritaires de l'Europe : France ; domaine ladin ; Aoste ; domaine basque ; domaine sarde ; domaine corse ; domaine occitan ; domaine catalan etc...
Partenaires
GDR 09 CNRS Langues et Cultures de France (NALF)
ALAR (Université de Grenoble) : M. Contini
Thesaurus Occitan (CEE) : M. Dalbéra Université de Nice
Atlas Linguistique basque : M. Aurrekoetxea (Bilbao et Vittoria)
Atlas linguistique ladin : M. Goebl, M. Bauer (Vienne)
DESCRIPTIF GLOBAL DU SERVICE ET DE LA MÉTHODE
DRAWCARTE.BASE_atlas © CLID JLFossat et Société Image (développeur)
DANS UNE MODÉLISATION PAR COUCHES
* fichiers de fonds de cartes (Gascogne ; Languedoc ; Romania; Pyrénées; domaine alpin; domaine cantalien etc...)
* Fichiers localités
* fichiers informateurs
* fichiers de formes phoniques
* fichier de formes morphologiques
* fichiers de vocables (formes graphiques ; lemmes par niveaux)
* fichiers de contextes (couche contextes : syntaxe-sémantique ; réseau anaphorique)
* fichier de concordances (couche des cooccurrences immédiates et calcul des distances)
* fichier par domaine étymologique (dictionnaire occitan étymologique)
* fichier par formes réduites
* fichier par catégories grammaticales
*formulaire de connaissances sur le monde (témoignages)
Méthode utilisée : DRAWCARTE.BASE© CLID JL Fossat et Société Image
Diffusion de l'outil
Société Image Toulouse 55 av. Bréguet 31500 Toulouse
tél 05 61 54 61 00
Historique de la méthode
La méthode présentée a été créée progressivement, dans une conception modulaire, depuis 1973 ; avec le concours essentiel de Jean-Marc Peytavi, mathématicien, spécialisé en analyse exploratoire des données, disparu précocément en 1994 (EDA ; alceste ; drawcarte) dans le cadre d'un projet de recherche dirigé par J.L. Fossat (CLID) et soutenu essentiellement par le Conseil Régional de Midi-Pyrénées.
Les principaux contributeurs à la base créée ont été, dans un souci de continuité de l'oeuvre linguistique de Jean Séguy, et de renouvellement des méthodes de traitement :
LINGUISTES
Jean Séguy 1973 : création de méthode dialectométrique (ALG 6)
chaque groupe a ses héros ; Jean Séguy est le nôtre
D. Philps (1985) prototypage sur des données de gascon pyrénéen
J.-L. Fossat : prototypage pour les données gasconnes ALG7 ; ALG8
L. Jagueneau (1998) prototypage sur des données dialectales de l'ouest poitevin
Gotzon Aurrekoetxea : prototypage pour le domaine basque (1994)
Lidia Rabassa : prototypage pour le domaine catalan andorran
MATHÉMATICIENS ET INGÉNIERIE DU traitement automatisé du langage
J.-M. Peytavi 1973-1994)
Choeb Zafar (Société Image, développement C ++)
Thierry Bousqué (Société Image), développeur
Patrick Lescure (Société Image), développeur
Zouheir Sandouk (IRIT c/o M. Caubet)
Jacques Vanpoucke (UPS, EDA) : modélisation
Eugène Horber (Université de Genève, EDA) : modélisation
Max Reinert (alceste) modélisation
A. Camlong (Stablex ; modèles gaussiens)
ARTISANS DU SITE ATLAS ELECTRONIQUE
* ATLAS CARTES (images cartes et son-image): GRIL_CPST(UTM)
Richard Loubéjac (GRIL-UTM) c/o M. Gauthier : projet web (Internet ; Perl)
M. Meqqori (GRIL-UTM) : projet web (Internet : PERL)
*ATLAS_base: Société Image (DRAWCARTE); THESOC (NICE, AIX, TOULOUSE 1997)
* DRAWCARTE
Junior Entreprise de l'UPS (1976-1986) : bases de données (dbase3 +)
Junior Entreprise de l'ENSICA : maquettes et cahier de charges
SOCIÉTÉ IMAGE, TOULOUSE : artisan principal (1991-1997) dans la perspective du THESOC 97
* ATLAS SON
SORENGO COMMUNICATION (TOULOUSE): M. Lamareille
CE QUE PERMET EN 1997, LA MÉTHODE CRÉÉE
Évolutive, et dans son état au 15 février 1997, la méthode DRAWCARTE.BASE_ATLAS permet, à tout utilisateur de niveau élémentaire, moyen ou avancé, et sans aucun obstacle ésotérique
* d'accéder à des data existants (occitan : gascon) et a des résultats (classification : cartographie)
* de créer ses propres données
* d'accéder à des résultats d'analyse exploratoire sur des datas existants
avec aide par un guide-manuel électronique accédé sur Internet
htt ://guide.atlas.fr/guests/fossat97 [donné occitan] en français
htt//guide.atlas. E/guests/gotzon97 [donné basque] en espagnol
* de procéder soi-même, sur tout type de donnée au format à toute analyse numérique exploratoire (EDA, ADDAD) et à la représentation précartographique de classes obtenues par modélisation graphique gaussienne fondée sur le calcul de similitude et le calcul de distances minimale et maximale
* de procéder à de nouvelles analyses
* de constituer un dictionnaire de formes phoniques, appariées à des vocables, à des formes réduites, à des étymons, à des localités, à des iinformateurs, à des catégories fonctionnelles et discursives
* d'entendre des formes phoniques visuelles transcrites (jouer le son)
* d'associer à toute information, indifféremment, un support sonore ou un support iconographique de la connaissance.
* d'acquérir des connaissances par une procédure d'interrogation de la base qui joue le rôle de MOTEUR : générateur de réponses à partir de questions (module ITEMS)
* de lever de manière décisive et incontestable, et à court terme, un certain nombre de réticences encore présentes dans certains milieux administratifs entre autres
- par la manipulation
- par la démonstration, juridiquement et mathématiquement fondée, de la fonction de la variabilité, de la fonction des polymorphismes langagiers.
* de réutiliser des matériaux lexicaux dans un outil didacticiel (système auteur et tutoriel, à demande), à plus long terme
Un manuel général sert de guide à l'utilisateur ; il sert de tutoriel ; un usager débutant a besoin d'une journée de formation pour avoir la maîtrise totale de la méthode : 1/2 journée sur le fonds et les aspects proprement linguistique ; 1/2 journée sur les manipulations de saisie, de contrôle et d'interrogation, de constitution de la base de connaissance à partir des supports sonore et visuel.
Comme la méthode présente un caractère général, elle permet de traiter toute donnée pour toute langue diu monde, toute police de caractères :
* module mots : abcès
* module groupes de mots : abcès du cou [.NdeN]
* module phrases de contrôle : < il a un abcès au doigt > concordance/contexte
* module des formes phoniques
* module des formes graphiques : vocables ; lemmes lexicographiques
* module de la réduction par lemmatisation : formes réduites
* module des formes à présegmentation morphologique
* module du générateur Q sur items de requête phonologique, graphique, morphologique, lexical, sémantique, syntaxique) : générateur Q/R de la méthode drawcarte
* module de constitution des tableaux de données pour l'analyse numérique
* module de la représentation cartographique : le support cartographique (visuel) comme outil de la base de connaissances, générateur d'hypothèses sur les normes plurielles
* outil FORUM : discussion ; évaluation ; relations internationales
Le projet se démarque des projets éditoriaux, non ouverts, fermés, non évolutifs ; l'une des caractéristique de la méthode est son caractère d'évolutivité et d'ouverture par l'outil FORUM ; il se veut ouvert à toutes catégories d'utilisateurs, accessible en manipulation, dans une perspective triple : descriptive, analytique et didactique.
Exemple de FORUM janvier 1997 (communication Université- associations)
fossat.multimedia &@cict.fr
- CLID/La Talvera
Résultat : base de textes occitans Contes e racontes de la ribièira d'Olt
TALVERA sous drawcarte.base_txt_© loddo.pardí !
- CLID/ERCV association 1901 : CD_ROM TEXTES
INTÉRESSÉS ?
Conditions d'accès en réseau interne : Maison de la Recherche : 1997 : janvier-mai 1997 ; toute la base peut vous être adressée par fichier attaché
Demande par simple contact
fossat@cict.fr
LA MÉTHODE DRAWCARTE.BASE PLUS 97
* puissance : traite des bases de données étendues
* rapidité : accès immédiat à l'information multidimensionnelle
* souplesse (traite des documents de tous ordre, par types de sources : atlas ; textes ; dictionnaires ; cartes géolinguistiques ; cadastres (documents microtoponymiques) associés à leur représentation cartographique, sur fonds de carte 2D
* convivialité du système 4D.C (ACI/Apple)
* partenaire privilégié : THESAURUS OCCITAN (THESOC)
Concepteur de la base de données (1991) : C.Li.D (Université de Toulouse II Le Mirail)

Coordinateur : Jean-Louis Fossat (1986-1997)
OBJECTIF
* MISE A DISPOSITION DE DONNEES LINGUISTIQUES DIALECTALES ET CREATION D'OUTILS LINGUISTIQUES.
* APPLICATIONS OUVERTES : CONCEPTION, REALISATION ET EXPLOITATION : DRAWCARTE PLUS 1997
* ARCHIVE SONORE NUMERISEE
* ATLAS PARLANT (THESOC)
* CARTE PARLANTE (THESOC)
* TEXTES PARLANTS (THESOC)
* DICTIONNAIRE MULTILINGUE PARLANT
* MICROTOPONYMIE PARLANTE
* CADASTRE PARLANT
* SERVEUR DEDIE OCCITAN
DEVELOPPEMENT ET DIFFUSION
Développement et diffusion :

INFORMATIQUE, MATHEMATIQUES, GESTION
IMAGE
55, Avenue Louis Bréguet
Bât 7
31400 TOULOUSE
Tél : 05-61-54-61-00
Fax : 05-61-80-53-03
QUI PEUT UTILISER DRAWCARTE PLUS 97 ?
DRAWCARTE PLUS 97 est un gestionnaire de données, destiné au traitement des données dialectales de tout type, et toute langue, toutes polices.
Il a été conçu et réalisé pour permettre une application sous 4D.5 puis 4.D.6 en prévision de l'étape de dissémination des données sur réseau INTRANET et INTERNET. Il est évolutif dans le monde PC/MSDOS/WINDOWS.
Il combine la convivialité d'une base de données textuelles écrites et/ou orales avec un outil de représentation graphique et cartographique (drawcarte proprement dit) et avec des outils d'analyse exploratoire des données (Hyperbase ; EDA ; Alceste (PC/MAC) ; Carte Données Plus sur APPLE et version PC ; Alliance sous windows/PC)
LES CATEGORIES DE DONNEES SOUS DRAWCARTE PLUS
* Les champs d'indexation
Ils permettent d'indexer, par NOTION, par LIEU_DATE_INDIVIDU_ENQUETEUR
- les formules graphiques normées (texte graphique)
- les formules graphiques phonologisantes
- les vocables (lemmes de la lexicographie)
- leurs formes réduites des lexèmes : mòver a pour forme réduite mòv >
- les variantes graphiques : mòver : màver : mòure
- les formules phonétiques/xxx/avec police API, autre
- les formules phonologiques
- les formules morphologiques (avec choix de police)
- les indicateurs grammaticaux
- le son associé
- l'image associée
- les concondances d'une unité
- les contextes larges d'une unité (définitions, notamment)
- les étymons

* Les champs de recherche
La recherche est opérée
- par notion
- par localité
- par témoin, sujet parlant, individu, personne-source
- par multi-index
formes phonétiques
formes morphologiques
indicateurs grammaticaux
étymons
- par items (déclaration des variables déclarées)
- par carte de données (carte-données) indiquant le fil directeur des partitions opérées
- sur bibliothèque d'images associées
- sur bibliothèque de son numérisé associé
Les écrans de cette page : écran IMAGE
Ecran SON
ECRAN TXT, CONCORD
ECRAN CARTE (couleurs)
DE LA STRUCTURATION DES FICHES DIALECTALES AUX REQUETES
Aux termes de son cahier de charges (CLID-ENSICA 1991) DRAWCARTE PLUS 97 permet une véritable gestion
* par notions indexées (ET collection d'Images associées)
* par requêtes (questions) indexées
* par langue
* par type, genre et nature de la source de l'information textuelle
* par application (atlas, textes, son, image, dictionnaire)
* par opération de projet (points et étapes)
Chaque fiche documente la relation entre
* une localité (ou groupe de localités) : attribut Localité :
HIS_O9C4 ; HIS09C3
* une date (champ datation du donné regroupé) : attribut DATE
* un témoin (ou groupe de témoins) : attribut Individu
* une notion (question) (ou groupe de notions) en langue-source
* une réponse, simple ou complexe, homogène ou hétérogène, en langue-cible
* l'ensemble des unités lexicographiques constituant les éléments de la réponse (mots réponses)
Pour chaque réponse, on fournit, par couches
* le signal sonore brut numérisé (aux normes européennes)
* la forme sonore transcrite aux normes API
* la forme transcrite en graphie phonologisante
* la formule de segmentation morphologique
* la formule grammaticale et sémantique (de type déclaratif)
* la formule lexicale "réduite" : forme réduite par soustraction
* la formule étymologique (origine par fonds)
* le dictionnaire des items phonétiques
* le dictionnaires des items phonologiques
* le dictionnaire des items morphologiques (catégories)
* le dictionnaire des items lexicaux (vocables)
* un dictionnaire d'items syntaxiques (labels syntaxiques)
* les partitions sur ces items
* la partition globale
* la carte des partitions, partielles ou globale.
AVANTAGES DE DRAWCARTE PLUS 97
* un outil flexible
chaque champ d'indexation peut avoir sa police propre, pour une application donnée
* un outil contrôlable
- un outil performant, avec ses recherches multicritères indexées, et ses ponts avec de multiples logiciels de traitements mathématiques.
# LA FONCTION RECHERCHE DANS LA METHODE DRAWCARTE PLUS 97
Les différentes fonctions de recherche permettent un accès immédiat aux informations souhaitées, triées et ordonnées.
* Recherche simple
- par localité
- pour un groupe de localités (bouquet A, B, C)
- par informateur (ou bouquet d'informateurs)
- par enquêteur
- par document type source : atlas XXX ; texte XXX ; dictionnaire xxx
document sonore xxx ; document iconographique xxx
- par notion
- par réponse (fiche texte)
- par forme transcrite
- parb graphie phonologisante
- par étymon
- par concordance rigide xxxxx [y] xxxxxxxx, sonorisable
- par contexte étendu, sonorisable, exportable
* Recherche complexe
- par items phonétiques
- par items phonologiques
- par items morphologiques
- par items lexicaux
- par items syntaxiques
* Recherche par "CARTE-CLASSE"
- par classe binaire, ternaire, n_aire (n classes)
- par carte n_aire
# LA FONCTION FILTRE
Cette fonction permet de définir et de combiner différents critères pour rendre encore plus efficaces et précises les recherches d'information.
Copie d'écran
LA PRESENTATION A L'ECRAN DES DONNEES, DES RESULTATS, DES CLASSES, DES CARTES
L'INTERFACE
Une fonction IMPORT/EXPORT permet l'interfaçage de
- 4D.6
- DRAWCARTE
- EDA (E. Horber)
LA FONCTION IMPORTATION/EXPORTATION
Cette fonction permet l'interfaçage de DRAWCARTE PLUS 97 avec :
- EDA (auteur : Eugène Horber), ADDAD
- ALCESTE (auteur : Max Reinert)
- CARTE-DONNEES + (Société Articque)
- ALLIANCE (Société CGE Toulouse)
- HYPERBASE (auteur : Etienne Brunet)
- LEXICO (auteur : A. Salem)
- EXCEL
- AUTRES SGBD
- TACT
- NATUREL
- SATO (textes) : auteur : F. Daoust (UQUAN, Montréal)
Elle permet de plus l'exportation et l'importation des données en direction de l'opération de regroupement THESOC (Thesaurus Occitan), sur double contrat CNRS et CEE DG XIII.
L'UTILISATION EN RESEAU
* Intranet
* Internet
Ce passage en version réseau est rendu encore plus aisé grâce à l'utilisation de la 4D.6 qui permet de transformer une application en page HTML.
Exigences techniques du système
* TABLEAU UTILISATEURS
ADMIN
UTLIS
INVITE
DROIT ACCES : LECTURE ; ECRITURE
No d'ordres des utilisateurs DU SYSTEME
* EQUIPEMENT
PowerPC 8200/8600 multimédia
Mémoire vive : 32 Mo, OPTIMUM (128)
Disque dur : 1 giga
Ecran couleur 15 pouces, 256 couleurs (17 pouces recommandé)
carte son DIGIDESIGN et AUDIOTOOLS
transportable en environnement PC/MSDOS/WINDOWS
liaison INTERNET (réseaux de la maison de la recherche)
CARACTERISTIQUES DE DRAWCARTE PLUS 97
* gestionnaire de données linguistiques verbalisées écrites et orales
- gestion des informations transcrites
- gestion de données orthographiques élaborées
- contrôle sur écrans de saisie (cohérence)
- écrans personnalisés (par application)
* gestionnaire de données sonores (signal brut numérisé)
* gestionnaire de données iconographiques
* gestionnaire de cartes
* gestionnaire lexicographique
- contextes, concordances
- fonction calcul, par exportation
* gestionnaire morphologique
* gestionnaire de notions
* fonctions de recherche
* fonctions de calcul (par exportation vers EDA, ALCESTE)
* fonction graphique et cartographique avancée (DRAWCARTE)
* fonctions d'importation et exportation avancées
* fonctions en réseau (INTERNET : 4D.6 DRAWCARTE PLUS 97)
* interfaçage avec ensemble d'outils et méthodes d'analyse
INTERESSES ?
Adressez- vous à
* Société IMAGE
Contact M. Choeb ZAFAR
adresse 55, Avanue Louis Bréguet ; Bât 7 ; 31400 TOULOUSE
email lescure@club-internet.fr
TEL 05 61 54 61 00
FAX 05 61 80 53 03
CONDITIONS D'ACQUISITION
Le coût du logiciel DRAWCARTE.BASE PLUS 97, avec son environnement de travail
Premier exemplaire : 8000 Frs HT
Premier exemplaire (partenaires CLID) : 1500 Frs HT
Exemplaires supplémentaires : 1500 Frs HT
Possiblité de formation en inter ou en intra.
* CLID/ERSS UMR 561O UTM (mise à disposition des données, conception des applications, réalisation, description, didacticiels, tutoriels)
adresse
fossat@univ-tlse2.fr
INTÉRESSÉS ?
Pour en savoir plus :
Contact JL. Fossat CLID Maison de la Recherche
Mel : Fossat @ cict.fr
et tél 05 61 50 36 81 (CLID)