Glossaire de A à Z

 

Tous A B C D E F G H I J K L M N O P Q R S T U V W X Y Z

C

Cartographie (ou Mapping) : Représentation visuelle des résultats de recherche ou des rapports de veille. Ils se présentent généralement sous forme de cartes qui indiquent les relations directes et indirectes identifiées au cours du cycle de veille.

Champ de veille : Ensemble homogène des données faisant l'objet d'une veille ; ex : dans une veille concurrentielle : les sociétés concurrentes directes ou les produits de substitution.

Chaîne : Une chaîne est une suite finie de sommets dont deux sommets successifs sont reliés par une arête. La chaîne est dite simple si elle n’utilise pas deux fois la même arête.

Chemin : Un chemin est une suite finie de sommets dont deux sommets successifs sont reliés par un arc.

Circuit : Dans un graphe orienté, on appelle circuit un chemin dont l’origine et l’extrémité sont identiques. Si le chemin est élémentaire, c'est-à-dire ne passe pas deux fois par un même sommet, on parle de circuit élémentaire.

Classe connexe : Dans un graphe non orienté, une classe simplement connexe est une classe d’équivalence pour la relation qui lie deux sommets par une chaîne. Dans le cas d’un graphe orienté on parle de classe fortement connexe. La relation d’équivalence devient alors la relation qui lie deux sommets par un circuit.

Cycle : Un cycle est une chaîne simple dont les deux extrémités coïncident.

Caractère : Un cycle est une chaîne simple dont les deux extrémités coïncident.

Caractères délimiteurs / non-délimiteurs : Distinction opérée sur l'ensemble des caractères, qui entrent dans la composition du texte permettant aux procédures informatisées de segmenter le texte en occurrences* (suite de caractères non-délimiteurs bornée à ses extrémités par des caractères délimiteurs). On distingue parmi les caractères délimiteurs:

• les caractères délimiteurs d'occurrence (encore appelés "délimiteurs de forme") qui sont en général : le blanc, les signes de ponctuation usuels, les signes de préanalyse éventuellement contenus dans le texte.

• les caractères délimiteurs de séquence : sous-ensemble des délimiteurs d'occurrence correspondant, en général, aux ponctuations faibles et fortes contenues dans la police des caractères.

• les caractères séparateurs de phrase : (sous-ensemble des délimiteurs de séquence) qui correspondent, en général, aux seules ponctuations fortes.

Classification par analyse de connexité : Dans ce cas, la matrice individus/variables ou la matrice de contingence croisant deux types de caractères sur une population donnée, est considérée comme celle d’un graphe non orienté dont on va rechercher les composantes simplement connexe. Comme la simple connexité est une relation d’équivalence, nous obtenons une partition de l’unité en différentes classes indépendantes les unes des autres. Si le graphe issu de la matrice est simplement connexe (une seule classe), il est alors possible de partiellement le déconnecter en enlevant les liens faibles (ici les arêtes de valeur 1 ou 2). Le tri fait alors apparaitre des classes faiblement liées que l’on peut considérer comme représentatives de la structure des données analysées.

Classification ascendante hiérarchique : Les méthodes hiérarchiques produisent des partitions en classes imbriquées de plus en plus grandes, le nombre de classes n’est pas connu à priori, plusieurs partitions imbriquées peuvent être proposées. La classification ascendante hiérarchique (C.A.H.) consiste à regrouper les individus en classes en fonction de deux critères:

• les individus d’une même classe sont le plus semblable possible,

• les classes sont les plus disjointes possibles. Pour cela, nous avons besoin d’une mesure globale de la proximité des individus à l’intérieur de chaque classe et de la distance interclasse pour apprécier la qualité de la partition obtenue. Comme il n’est pas envisageable d’évaluer toutes les partitions pour ne garder que la meilleure au sens du critère choisi (problème trop fortement combinatoire), il est donc exclu de trouver cette meilleure partition

Cooccurrence : Présence simultanée, mais non forcément contiguë, dans un fragment de texte (séquence, phrase, paragraphe, voisinage d'une occurrence, partie du corpus, …) des occurrences de deux formes données.

Corpus : Ensemble limité des éléments (énoncés) sur lesquels se base l'étude d'un phénomène linguistique. En lexicométrie, il s’agit de l’ensemble de textes réunis à des fins de comparaison, servant de base à une étude quantitative.