Nom du champ |
Abréviation |
Champ |
Visible |
Séparateurs |
Nom complet du champ de données |
Choix de l'abréviation |
Champs correspondant dans la base |
Tous les champs de la base doivent être représentés TRUE = actif FALSE = passif |
Le choix dépend de l'ordonnance-ment interne des données. On isole les groupes de mots intéressant |
Fig : Exemple d'une notice bibliographique de la base Biosis.
Fig : Exemple du contenu du fichier "basededonnes" correspondant
Par l'expérience, vous apprécierez vous-même comment concevoir ces fichiers. Pour vous donner des idées, des modèles de "basesdedonnees" sont joints en annexe n°2.
Nous vous donnons des indications pour vérifier simplement si vous n'avez pas commis d'erreurs.
Fig : Présentation de la fenêtre de synonymie
Fig : Représentation schématique des opérations du second comptage
Nom du champ |
Fréquence minimale d'apparition des termes |
% |
liste de mots .Filtre |
Synonymes .Syn |
|
Nom du champ |
matrice de croisement |
au choix (0 à tous) |
les basses fréquences à éliminer |
les filtres positfs ou négatifs |
les dictionnaires de synonymes |
opération à réaliser |
cliquer |
modifier en entrant la valeur choisie |
modifier en entrant la valeur choisie |
insérer uniquement le nom avec un moins si le filtre est négatif |
insérer uniquement le nom avec un moins si le filtre est négatif |
Ce que vous observez |
Méthode |
|
- Opération n°1 : Vous n'obtenez pas des groupes homogènes le long de la diagonale par un simple tri de connexité ou de bloc : |
-
Transformation en divisant les cellules par la racine carrée
des marginales, |
|
- Opération n°2 : La première opération a peu de résultat |
- Choisir de préférence des tris par blocs plutôt que des tris de connexité. |
|
- Opération n°3 : J'obtiens des groupes vers le bas de ma diagonale mais le reste est toujours lié : |
Procéder de façon récursive : -
Isoler la partie toujours liée en la sauvegardant sous
un autre nom, |
|
Quelques soient les tris toutes mes informations sont liées |
Regardez le synonymage et vérifiez vos filtres ainsi que le Thésaurus créé. Il doit y avoir une erreur quelque part. Avez-vous pensé au seuil d'érosion ? |
|
J'ai fait une AFC, ai-je besoin de triér mes données ? |
Non, l'AFC et l'ACP s'observent d'elles-mêmes. Par contre, pour vérifier les résultats, il est intéressant de trier récursivement en utilisant les outils mis à votre disposition. |
Fig : Représentation schématique des premières étapes de la cooccurrence de multi-termes.
- Cliquer
sur la fonction Multi-termes
- Mettre en
entrée le fichier des mots vides et une liste des mots composés
avec tirets extraite des titres et des abstracts,
- Choisir
un indice de fréquence d'apparition faible (au moins deux ou trois)
- sed " s / - / / g " Champ.mul > dico1
- cat
Thésaurus dico1 > dico2
Fusionne les fichiers Thésaurus et dico1 dans le fichier : dico2
- sort
-u dico2 > THESAURUS2
Dédoublonne et dispose la liste des mots par ordre alphabétique
Fig : Présentation d'une notice comprenant le nouveau champ MTM
Remarque :
Fig : Opérations nécessaires pour le comptage de mots composés
Remarque :