Introduction aux Statistiques

Citation :
Introduction aux statistiques - © 1996, Ramousse R., Le Berre M. & Le Guelte L.

6.5. L’analyse factorielle des correspondances

L’analyse factorielle des correspondances traite des tableaux de contingence (tableaux de dépendance) dans lesquels un couple (i, j) correspond à un nombre positif kij qui est en général le résultat d’un dénombrement.

6.5.1. Données initiales

Les données de base sont habituellement regroupées dans un tableau. On étudie simultanément, sur une population, deux variables qualitatives I, J pouvant prendre respectivement n et p valeurs (ou modalités). On note kij le nombre d’individus appartenant simultanément aux catégories i et j des variables I et J.

Au tableau kij, sont associés deux tableaux à une dimension chacun : le tableau des marges en ligne kI et le tableau des marges en colonne kJ. L’ensemble tableau de contingence et tableaux marginaux est représenté ci-dessous :

Par exemple : le tableau 10x8 ci-dessous croise 10 catégories socioprofessionnelles avec 8 modes d’hébergements en vacances.

I\J
hôtel

locat

propri

parent

amis

tente

villag

divers
total

Agriculteur
160

28

0

321

36

141

45

65
796

Salariés
35

34

1

178

8

0

4

0
260

Patrons
700

354

229

959

185

292

119

140
2978

Cadre sup
961

471

633

1580

305

360

162

148
4620

Cadre moy
572

537

279

1689

206

748

155

112
4298

Employés
441

404

166

1079

178

434

178

92
2972

Ouvriers
783

1114

387

4052

497

1464

525

387
9209

Personnels
65

43

21

294

79

57

18

6
580

Autres actif
77

60

189

839

53

124

28

53
1423

Non actifs
741

332

327

1789

311

236

102

102
3940

Total
4535

3377

2232

12780

1858

3856

1336

1105
31079

Tableau 1

Dans ce tableau, lignes et colonnes jouent des rôles analogues : ce sont deux partition d’une même population. Pour que les distances entre points-lignes et points-colonnes aient un sens, il faudra faire intervenir les profils des lignes et des colonnes, c-à-d les répartitions en pourcentage à l’intérieur d’une ligne et d’une colonne. En effet, deux observations i et i’ seront considérées comme identiques si les lignes correspondantes sont proportionnelles.

En effet, la distance entre, par exemple, le point " ouvrier " et le point " personnel de service ", calculée à pertir des effectifs bruts du tableau 1, ne ferait que traduire les différences d’effectifs, considérables, entre ces deux catégories. Par contre, calculée sur les profils-lignes du tableau 2, elle traduira les différences de comportement vis-à-vis du mode d’hébergement en vacances, en comparant les pourcentages de chacun de ces modes, sans tenir compte des effectifs totaux des deux catégories. De la même façon, pour comparer deux modes d’hébergements, on consultera les profils socio-professionnels du tableau 3.

On définira donc le tableau des profils de I sur J en posant :

On crée ainsi des profils d’hébergement (profils lignes) : tableau 2 (100 x )

I\J
hôtel

locat

propri

paren

amis

tente

villag

divers

total

Agricult
20,1

3,5

0,0

40,4

4,5

17,7

5,7

8,1

100,00

Salariés
13,4

13,1

0,4

68,5

3,1

0,0

1,5

0,0

100,00

Patrons
23,5

11,9

7,7

32,2

6,2

9,8

4,0

4,7

100,00

Cadre s
20,8

10,2

13,7

34,2

6,6

7,8

3,5

3,2

100,00

Cadre m
13,3

12,5

6,5

39,3

4,8

17,4

3,6

2,6

100,00

Employés
14,8

13,6

5,6

36,3

6,0

14,6

6,0

3,1

100,00

Ouvrier
8,5

12,1

4,2

44,0

5,4

15,9

5,7

4,2

100,00

Personnel
11,1

7,4

3,6

50,4

13,6

9,8

3,1

1,0

100,00

Autres actif
5,4

4,2

13,3

59,0

3,7

8,7

3,0

3,7

100,00

Non actifs
18,8

8,4

8,3

45,4

7,9

6,0

2,6

2,6

100,00

Profil marginal de J
14,6

10,9

7,2

41,0

6,0

12,4

4,3

3,6

100,00

Tableau 2

et des profils socio-professionnels (profils colonnes) : tableau 3 (100 x)

I\J
hôtel

locat

propri

paren

amis

tente

villag

divers
Profil marg. I

Agricult
3,5

0,8

0,0

2,5

1,9

3,6

3,4

5,9

2,6

Salariés
0,8

1,0

0,0

1,4

0,4

0,0

0,3

0,0

0,8

Patrons
15,5

10,5

10,3

7,5

10,0

7,6

8,9

12,7

9,6

Cadre s
21,2

13,9

28,4

12,4

16,4

9,3

12,2

13,4

14,9

Cadre m
12,6

15,9

12,6

13,2

11,1

19,4

11,6

10,1

13,8

Employés
9,7

12,0

7,4

8,4

9,6

11,3

13,3

8,3

9,6

Ouvrier
17,3

33,0

17,3

31,7

26,8

38,0

39,3

35,0

29,5

Personnel
1,4

1,3

0,9

2,3

4,2

1,5

1,3

0,5

1,9

Autres actif
1,7

1,8

8,5

6,6

2,9

3,2

2,1

4,8

4,6

Non actifs
16,3

9,8

14,6

14,0

16,7

6,1

7,6

9,3

12,7

total

100,00

100,00

100,00

100,00

100,00

100,00

100,00

100,00

100,00

Tableau 3

Ce sont les tableaux 2 et 3 qui définiront les coordonnées dans les deux espaces (sous forme de fréquences et non de pourcentages : totaux de lignes ou colonnes égaux à 1 au lieu de 100).

Notations :

effectif total dans le tableau

k =

fréquences relatives

fij =

fréquences relatives marginales lignes

fi. =

fréquences relatives marginales colonnes

f.j =

6.5.2. Définition des nuages de points

• Dans l’espace Rp on construit un nuage de n points, chaque point i ayant pour coordonnées les quantités : { ; j=1, 2, ..., p} et étant affecté de la masse fi.

Ces n points seront situés dans un sous-espace à p-1 dimensions, leurs n coordonnées vérifiant la relation pour tout i=1, ..., n.

• Dans l’espace Rn on construit un nuage de p points, chaque point j ayant pour coordonnées les quantités : { ; i=1, 2, ..., n} et étant affecté de la masse f.j

Ces p points seront situés dans un sous-espace à n-1 dimensions, leurs p coordonnées vérifiant la relation pour tout j=1, ..., p.

• Les proximités entre les points s’interprètent alors en terme de proximités entre profils.

On choisit comme dimension de départ celle correspondant à la plus petite dimension du tableau. Dans l’exemple, on se placera dans Rn où n = 8.

Choix des distances

Pour travailler sur des profils, dans les espaces Rp et Rn on munit ces espaces d’une distance différente de la distance euclidienne usuelle : la distance du Chi-deux (distance pondérée).

La distance entre deux catégories socio-professionnelle i et i’ sera donnée par :

d2(i, i’) = (1)

La distance entre deux modes d’hébergement j et j’ sera :

d2(j, j’) = (2)

La distance du Chi-deux vérifie le principe d’équivalence distributionnelle.

Principe d’équivalence distributionnelle :

Si deux points-lignes i1 et i2 sont confondus dans Rp et si on les considère comme un seul point afffecté de la somme des masses de i1 et de i2 (remplacés par i0) alors les distances entre tous les couples de points dans Rp et dans Rn restent inchangés. Il en est de même pour deux points-colonne j1 et j2 de Rn ayant les mêmes propriétés. (:309)

Cette distance doit rendre " proches " des points de I dont les associations à J, dont les comportements sur J (donc les profils) sont voisins ou semblables. De même, cette distance fera paraître " éloignés " des points différant sensiblement selon J.

6.5.3. Résultats de l’analyse

Les AFC sont réalisée par voie informatique. Les résultats délivrés par la machine comprennent les valeurs propres, pourcentages d’inertie, coordonnées factorielles et contributions relatives et absolues.

• Le support du nuage est un espace à n-1 = 8-1 = 7 dimensions.

• La trace de la matrice = 0,0839 (c’est la somme des valeurs propres autres que 1)

• Les valeurs propres interviennent par le biais du coefficient pour caractériser la qualité de la représentation simultanée.

La "valeur propre" représente, pour chaque facteur, le montant de l’inertie du nuage sur ce facteur par rapport à la somme de toutes les valeurs propres qui représente 100% de cette inertie.

Facteur valeur propre % variance % cumulés

1 0,0443 53,01 53,01

2 0,0202 24,22 77,23

3 0,0088 10,53 87,76

4 0,0054 6,54 94,30

5 0,0023 2,85 97,15

6 0,0021 2,57 99,71

7 0,0002 0,29 100,00

Tableau 4 - Valeurs propres et pourcentages de variance des facteurs.

j Masse Coord Cabs Crel

fj j1j j 2j j 3j ca1j ca2j ca3j cr1j cr2j cr3j

Hôtel
0,146 0,33 0,17 0,09 35,7 22,0 12,5 0,73 0,20 0,05

Location
0,109 -0,08 0,14 -0,06 1,5 10,2 4,4 0,12 0,37 0,07

Propriété
0,072 0,41 -0,13 -0,26 26,9 6,1 56,3 0,65 0,07 0,27

Parents
0,411 -0,06 -0,14 0,04 3,8 41,7 6,9 0,15 0,78 0,06

Amis
0,060 0,11 -0,01 0,12 1,7 0,0 9,1 0,20 0,00 0,21

Tente
0,124 -0,30 0,14 -0,09 25,4 12,1 10,3 1,72 0,16 0,06

Village
0,043 -0,21 0,16 -0,02 4,4 5,6 0,1 0,47 0,27 0,00

Divers
0,036 -0,08 0,11 0,03 0,5 2,2 0,5 0,07 0,12 0,01

Tableau 5 - Paramètres des points-colonnes (Modes d’hébergement)

j ?= identificateur des variables

Masse ?= poids associé au point j = fj

jaj ?= coordonnée de la variable j sur l’axe de rang a

caaj ?= = contribution absolue de la variable j à la variance de l’axe a.

craj ?= contribution relative de a à l’inertie de j = = cosinus carré de l’angle formé par j et l’axe a = explication de la variable j par l’axe de rang a

i Masse Coordonnées Contribut. absolues Contrib. relatives

fi y1i y2i y3i ca1i ca2i ca3i cr1i cr2i cr3i

Agricult 0,026 -0,14 0,18 0,24 1,1 3,9 17,3 0,08 0,13 0,25

Salariés 0,008 -0,04 -0,39 0,35 0,0 6,1 11,4 0,00 0,34 0,27

Patrons 0,096 0,21 0,18 0,06 9,5 16,0 3,5 0,52 0,40 0,04

Cadre s 0,149 0,33 0,02 -0,10 35,6 0,3 16,7 0,90 0,00 0,08

Cadre m 0,138 -0,10 0,06 -0,07 3,2 2,4 8,3 0,33 0,11 0,17

Employé 0,096 -0,07 0,13 -0,01 1,0 8,0 0,2 0,18 0,62 0,01

Ouvrier 0,296 -0,24 -0,01 -0,01 37,3 0,1 0,2 0,97 0,00 0,00

Personnel 0,019 -0,04 -0,20 0,24 0,1 3,7 12,2 0,01 0,22 0,31

Autre actif 0,046 0,01 -0,47 -0,13 0,0 50,7 8,8 0,00 0,86 0,07

Non actifs 0,127 0,21 -0,12 0,12 12,2 8,6 21,5 0,59 0,19 0,21

Tableau 5bis - Paramètres des points-lignes (Catégories socio-professionnelle)

i ?= identificateur des variables

Masse fi?= poids marginal associé au point i

yai ?= coordonnée de l’individu i sur l’axe de rang a

caai ?= = contribution absolue de l’individu i à la variance de l’axe a.

crai ?= contribution relative de a à l’excentricité de i = = cosinus carré de l’angle formé par i et l’axe a = explication de l’individu i par l’axe de rang a

6.5.3.1. les contributions absolues, Caa (i) et Caa (j)

Elles expriment la part prise par un élément donné dans la variance expliquée par un facteur. Elles permettent de savoir quelles variables interviennent fortement dans la construction d’un facteur.

mesure la part de l’élément i dans la variance expliquée de l’axe a. Nous aurons

La contribution absolue de l’élément j à l’axe a est

Les points ayant de fortes contributions absolues sur un axe a sont ceux qui contribuent à définir la signification de cet axe factoriel. Ce sont les points explicatifs de l’axe.

6.5.3.2. les contributions relatives, Cra(i) et Cra (j)

Elles expriment la part prise par un facteur dans l’explication de la dispersion d’un élément.

. C’est le carré du cosinus du point i avec l’axe a. Il s’interprète comme le carré d’un coefficient de corrélation.

La contribution relative de l’élément j à l’axe a est .

G et H sont les centres de gravité des nuages de points en Rp et Rn ; d est la distance du point i au centre de gravité.

Les points ayant de fortes contributions relatives sur un axe a sont les points expliqués de l’axe.

6.5.4. Représentation graphique dans le premier plan factoriel

L’un des intérêts de l’AFC est de permettre une représentation graphique des nuages de points I et J dans un espace de faible dimension, permettant de mettre en évidence des éléments (correspondances) que le calcul numérique ne permet pas d’apprécier instantanément.

Traditionnellement, la représentation se fait en 2 dimensions, en traçant successivement les plans factoriels F1/F2, F1/F3 et F2/F3 (et plus, si davantage de facteurs sont requis dans l’interprétation).

Pour les représentations, les coordonnées sont celles calculées au § 4.3.

Les proximités observables sur le premier plan factoriel sont schématisées sur la figure 1.

Figure 1

La proximité entre deux points-lignes (catégories socio-professionnelles) traduit une similitude des profils d’hébergement (ex: " patrons " et " professions libérales ").

La proximité entre deux points-colonnes (modes d’hébergement) traduit une similitude des profils socio-professionnels (ex : " village vacance " et " tentes & caravanes ").

La représentation simultanée des points lignes et des points colonnes permet d’identifier les variables responsables de certaines proximités.

Les proximités entre profils s’interprètent par référence au profil moyen. Les proximités sont plus aisées à interpréter à la périphérie du graphique.

Les variables responsables de la construction des axes (contributions absolues fortes) sont pour le premier axe : " Hôtel ", " Maisons en propriété " et " Tentes/caravanes " (qui expliquent 88% de la variance). L’hébergement " Village de vacance " participe peu car sa masse est 3 fois plus faible que " Tente-caravane ". Pour l’axe 2, l’hébergement " Chez des parents " a une forte contribution (41,7) alors que " Maison en propriété " n’est que de 6,1.

Pour les catégories socio-professionnelles, " Cadres sup " et " Ouvrier " définissent le premier axe (73%). En raison de leurs contributions relatives, ces deux catégories ne caractérisent que ce premier axe.

Le graphique doit être lu à la clarté des tableaux qui permettent de nuancer son interprétation.

6.5.5. Aides à l’interprétation

1. Les axes factoriels relatifs aux plus grandes valeurs propres sont ceux qui discriminent le plus les points des nuages car, dans les directions de ces axes, l’inertie est la plus grande. Tous les axes factoriels sont, par construction, orthogonaux, c’est à dire non corrélés deux à deux.

2. Pour interpréter un axe, il faut examiner les extrêmes selon cet axe et exprimer, en langage clair, la raison de l’opposition, en intégrant tous les points, en particulier ceux qui ont une contribution absolue importante. Ceci amène à ne pas tenir compte de certains points très " légers ", éloignés sur les axes.

3. Un premier facteur qui représenterait 10% de l’inertie totale serait très significatif, dans l’étude d’un questionnaire, par exemple.

4. Lorsque l’on passe d’un taux d’inertie donné pour un facteur à un taux d’inertie nettement plus faible pour le facteur suivant, le premier cité a généralement un sens clair.

5. Il vaut mieux examiner un facteur sur un plan que sur un axe. Il est prudent de se méfier de l’association étroite que l’on accorderait à deux points i et j à la vue d’un seul plan factoriel. Cette proximité sur un plan peut être contredite par des coordonnées très différentes (signe opposé) sur une autre facteur (i.e. : ne pas se contenter d’examiner le plan F1F2, envisager également F1F3 et F2F3).

6.5.6. Etude détaillée des résultats d’un exemple d’AFC

Le tableau ci-dessous représente le nombre de dépôts de brevets en télécommunication dans 9 pays, au cours des années 1980 à 1986.

I\J 1986 1985 1984 1983 1982 1981 1980

USA
986

774

711

591

467

404

258

Japon

653

552

361

307

195

129

43

RFA

405

357

347

254

294

313

208

France

189

158

200

171

153

184

147

GB

204

182

158

137

92

86

67

Italie

31

28

28

21

22

29

15

Pays-Bas

64

59

61

64

33

30

11

Suède

25

19

31

25

15

12

13

Suisse

23

34

19

30

17

30

15

6.5.6.1. Les valeurs propres et paramètres associés

Le tableau des valeurs propres réunit :

• Le numéro d’ordre des valeurs propres classées par ordre décroissant (a = 2, ..., p) [l1= 1 : la première valeur propre est égale à 1 et n’intervient pas dans l’analyse]

• le nombre d’itération par facteur pour obtenir les résultats numériques

• les valeurs propres (autres que 1) la de la matrice diagonalisée. La somme des valeurs propres, ou trace de la matrice, est exprimée en bas du tableau =

• le pourcentage d’inertie de chaque axe factoriel a =

• les pourcentages d’inertie cumulés.

a iterations V.p. = la % d’inertie % cumulés

2 0 0.04104792 88.998 88.998

3 1 0.00276522 5.995 94.993

4 2 0.00145948 3.164 98.158

5 2 0.00068186 1.478 99.636

6 2 0.00012750 0.276 99.912

7 5 0.00004043 0.088 100.000

Trace = 0.04612241

La première valeur propre représente un très grand pourcentage de la varaince totale. C’est un cas d’école!

6.5.6.2. Coordonnées factorielles et interprétation des points variables j de N(J)

Coordonnées factorielles

Les coordonnées factorielles des points variables j sont données par la formule

où est la ième composante du vecteur propre de la matrice S*=YY’.

Les coordonnées factorielles des points variables j sont publiées dans le tableau suivant :

1er facteur 2ème facteur 3ème facteur

n j qlts pds inr j1j cor1j ctr1j j2j cor2j ctr2j j3j cor3j ctr3j

1

1986

1000

223

183

190

958

197

-28

23

69

13

4

26

2

1985

1000

187

135

171

882

133

-35

40

90

-48

71

302

3

1984

1000

166

17

10

20

0

44

428

118

47

479

251

4

1983

999

138

40

26

50

2

107

858

569

-26

53

67

5

1982

999

111

51

-127

779

45

-34

57

48

56

148

239

6

1981

1001

106

240

-315

955

258

-51

26

103

-7

1

5

7

1980

999

68

335

-468

969

365

9

0

2

-47

10

110

1000

1000

1000

1000

où :

n ?= numéro d’ordre des variables

j ?= identificateur des variables

qlts(j) ?=Qualité d’explication du point j dans l’espace factoriel composé de s facteurs.

pds ?= poids associé au point j = fj

inr ?= pourcentage d’inertie de chaque point j par rapport à l’inertie totale du nuage = fj-r2(j)/M2(N(J)) ; r(j) = excentricité du point j.

jaj ?= coordonnée de la variable j sur l’axe de rang a.

coraj ?= contribution relative de a à l’inertie de j = = cosinus carré de l’angle formé par j et l’axe a = explication de la variable j par l’axe de rang a.

ctraj ?= = contribution absolue de la variable j à la variance de l’axe a.

Règles d’interprétation des axes factoriels par les points variables j

1. Points explicatifs

Les points explicatifs de l’axe permettent d’interpréter la signification du facteur considéré. Il s’agit des points ayant, pour les coordonnées positives et pour les coordonnées négatives, les plus fortes valeurs de contribution ctraj.

Ici, il s’agit de :

coordonnées négatives

coordonnées positives

axe 1

1980 (365)

1981 (258)

1986 (197)

axe 2

1981

1983 (569)

axe 3

néant

néant

2. Points expliqués

Ce sont ceux dont la contribution relative à l’excentricité coraj est forte, c’est-à-dire supérieure à un seuil défini, ici 500. Ces points sont :

coordonnées négatives

coordonnées positives

axe 1

1980 (969)

1981 (955)

1986 (958)

1985 (882)

axe 2

néant

1983 (569)

Il n’y a pas de points expliqués pour l’axe 3.

3. Interprétation

L’axe 1 définit une croissance des dépôts de brevet entre les années de début (1980, 81) et la fin (1986), avec une forte contribution des années 80, 81, 85 et 86.

L’axe 2 fait ressortir l’importance de l’année 1983.

L’axe 3 traduit l’opposition entre les années 82/84 et 85.

6.5.6.3. Les coordonnées factorielles des points individus i de N(I)

Coordonnées factorielles

Les coordonnées factorielles des points individus i sont données par la formule

où est la ième composante du vecteur propre de la matrice T*=YY’.

Les coordonnées factorielles des points individus i sont publiées dans le tableau suivant :

1er facteur 2ème facteur 3ème facteur

n i qlts pds inr y1i cor1i ctr1i y2i cor2i ctr2i y3i cor3i ctr3i

1

USA

1000

363

18

39

681

14

12

65

19

20

183

103

2

Japo

1000

194

431

318

988

478

-28

8

60

-19

4

54

3

RFA

100

189

183

-198

891

183

-65

98

299

15

5

30

4

F

100

104

232

-317

983

256

36

12

48

-8

1

6

5

GB

1000

80

8

24

134

1

40

365

47

-33

259

64

6

Ital

1001

15

19

-212

798

17

-63

71

22

10

2

1

7

NL

1000

28

31

86

144

5

172

571

298

16

5

5

8

Suè

999

12

17

-100

153

3

216

702

205

57

49

27

9

CH

1000

15

61

-338

627

43

22

3

3

-258

365

709

1000

1000

1000

1000

où :

n = numéro d’ordre des variables

i = identificateur des variables

qlts(i) ?= Qualité d’explication du point i dans l’espace factoriel composé de s facteurs, qlts(i) =

pds ?= poids marginal associé au point j = fi

inr ?= pourcentage d’inertie de chaque point i par rapport à la variance totale du nuage M2(N(I)) = fi-r2(i)/M2(N(I)) ; r(i) = excentricité du point i ;

yai ?= coordonnée de l’individu i sur l’axe de rang a

corai ?= contribution relative de a à l’excentricité de i = = cosinus carré de l’angle formé par i et l’axe a = explication de l’individu i par l’axe de rang a

ctrai ?= = contribution absolue de l’individu i à la variance de l’axe a.

Règles d’interprétation des axes factoriels par les points individus

1. Points explicatifs

Ce sont les points dont la contribution relative à la variance de l’axe a est prépondérante. Il s’agit des points ayant, pour les coordonnées positives et pour les coordonnées négatives, les plus fortes valeurs de contribution ctra(i).

Ici, il s’agit de :

coordonnées négatives

coordonnées positives

axe 1

France (256)

RFA (183)

Japon (478)

axe 2

RFA (299)

NL (298)

Suède (205)

axe 3

Suisse CH (709)

Néant

C’est sur ces points que doit s’appuyer l’interprétation de l’axe factoriel correspondant.

2. Points expliqués

Ce sont ceux dont la contribution relative à l’excentricité cora(i) est forte, c’est-à-dire supérieure à un seuil défini, ici 500. Ces points sont :

coordonnées négatives

coordonnées positives

axe 1

France (983)

RFA (891)

Italie (798)

Suisse (627)

Japon (988)

USA (681)

axe 2

néant

NL (571)

Suède (702)

axe 3

Néant

Néant

Il n’y a pas de points expliqués pour l’axe 3.

3. Interprétation

L’axe 1 oppose la forte croissance du Japon et des USA à la faible croissance de la RFA et de la France.

L’axe 2 oppose les effets d’intensité de NL et Suède qui doublent leurs dépots.

L’axe 3 est déterminé par la Suisse dont les dépôts de brevets tendent à décroitre.

6.5.6.4. Qualités d’explication

La qualité globale d’explication qges ou variance totale expliquée

Elle correspond à la somme des pourcentages de variance des s axes considérés comme interprétables. Voir le tableau § 442. Ici, nous aurons pour

le facteur F1

88.998

89 %

les facteurs F1 et F2

94.993

95 %

les facteurs F1, F2 et F3

98.158

98 %

... de la variance totale expliquée. Généralement on se contente de 80 % d’explication totale de la variance. Les très fortes valeurs obtenues dans cet exemple montrent le caractère trivial des facteurs mis en évidence.

La qualité locale d’explication qlts

Pour chaque point individu et chaque pont variable, il est possible de calculer une qualité d’explication dans un espace factoriel de rang défini (s) :

qlts (i) = et qlts (j) =

I\ qlt

qlt1

qlt2

qlt3

J\ qlt

qlt1

qlt2

qlt3

USA

681

746

929

1986

958

981

985

Japon

988

996

1000

1985

882

922

993

RFA

891

989

994

1984

20

448

927

France

983

995

996

1983

50

908

961

GB

134

499

758

1982

779

836

984

Italie

798

869

871

1891

995

981

982

Pays Bas

144

715

720

1980

969

969

979

Suède

153

855

904

Suisse

627

630

995

6.5.6.5. Représentation graphique

La représentation peut se faire séparément pour chacun des ensemble I et J ou sur le même système d’axes. Dans le cas de très grands tableaux, seuls les points explicatifs et expliqués seront représentés.

Représentation des points i de N(I) et j de N(J) dans l’espace factoriel (1, 2).

Représentation des points i de N(I) et j de N(J) dans l’espace factoriel (1, 3).

I\J	hôtel	locat	propri	parent	amis	tente	villag	divers	total
Agriculteur	160	28	0	321	36	141	45	65	796
Salariés	35	34	1	178	8	0	4	0	260
Patrons	700	354	229	959	185	292	119	140	2978
Cadre sup	961	471	633	1580	305	360	162	148	4620
Cadre moy	572	537	279	1689	206	748	155	112	4298
Employés	441	404	166	1079	178	434	178	92	2972
Ouvriers	783	1114	387	4052	497	1464	525	387	9209
Personnels	65	43	21	294	79	57	18	6	580
Autres actif	77	60	189	839	53	124	28	53	1423
Non actifs	741	332	327	1789	311	236	102	102	3940
Total	4535	3377	2232	12780	1858	3856	1336	1105	31079

effectif total dans le tableau	k =
fréquences relatives	fij =
fréquences relatives marginales lignes	fi. =
fréquences relatives marginales colonnes	f.j =

Facteur	valeur propre	% variance	% cumulés
1	0,0443	53,01	53,01
2	0,0202	24,22	77,23
3	0,0088	10,53	87,76
4	0,0054	6,54	94,30
5	0,0023	2,85	97,15
6	0,0021	2,57	99,71
7	0,0002	0,29	100,00

j	Masse		Coord			Cabs				Crel
	fj	j1j	j 2j	j 3j	ca1j	ca2j		ca3j	cr1j	cr2j	cr3j
Hôtel	0,146	0,33	0,17	0,09	35,7	22,0	12,5		0,73	0,20	0,05
Location	0,109	-0,08	0,14	-0,06	1,5	10,2	4,4		0,12	0,37	0,07
Propriété	0,072	0,41	-0,13	-0,26	26,9	6,1	56,3		0,65	0,07	0,27
Parents	0,411	-0,06	-0,14	0,04	3,8	41,7	6,9		0,15	0,78	0,06
Amis	0,060	0,11	-0,01	0,12	1,7	0,0	9,1		0,20	0,00	0,21
Tente	0,124	-0,30	0,14	-0,09	25,4	12,1	10,3		1,72	0,16	0,06
Village	0,043	-0,21	0,16	-0,02	4,4	5,6	0,1		0,47	0,27	0,00
Divers	0,036	-0,08	0,11	0,03	0,5	2,2	0,5		0,07	0,12	0,01

i	Masse	Coordonnées			Contribut. absolues			Contrib. relatives
	fi	y1i	y2i	y3i	ca1i	ca2i	ca3i	cr1i	cr2i	cr3i
Agricult	0,026	-0,14	0,18	0,24	1,1	3,9	17,3	0,08	0,13	0,25
Salariés	0,008	-0,04	-0,39	0,35	0,0	6,1	11,4	0,00	0,34	0,27
Patrons	0,096	0,21	0,18	0,06	9,5	16,0	3,5	0,52	0,40	0,04
Cadre s	0,149	0,33	0,02	-0,10	35,6	0,3	16,7	0,90	0,00	0,08
Cadre m	0,138	-0,10	0,06	-0,07	3,2	2,4	8,3	0,33	0,11	0,17
Employé	0,096	-0,07	0,13	-0,01	1,0	8,0	0,2	0,18	0,62	0,01
Ouvrier	0,296	-0,24	-0,01	-0,01	37,3	0,1	0,2	0,97	0,00	0,00
Personnel	0,019	-0,04	-0,20	0,24	0,1	3,7	12,2	0,01	0,22	0,31
Autre actif	0,046	0,01	-0,47	-0,13	0,0	50,7	8,8	0,00	0,86	0,07
Non actifs	0,127	0,21	-0,12	0,12	12,2	8,6	21,5	0,59	0,19	0,21

I\J	1986	1985	1984	1983	1982	1981	1980
USA	986	774	711	591	467	404	258
Japon	653	552	361	307	195	129	43
RFA	405	357	347	254	294	313	208
France	189	158	200	171	153	184	147
GB	204	182	158	137	92	86	67
Italie	31	28	28	21	22	29	15
Pays-Bas	64	59	61	64	33	30	11
Suède	25	19	31	25	15	12	13
Suisse	23	34	19	30	17	30	15

a	iterations	V.p. = la	% d’inertie	% cumulés
2	0	0.04104792	88.998	88.998
3	1	0.00276522	5.995	94.993
4	2	0.00145948	3.164	98.158
5	2	0.00068186	1.478	99.636
6	2	0.00012750	0.276	99.912
7	5	0.00004043	0.088	100.000
	Trace =	0.04612241

					1er facteur					2ème facteur				3ème facteur
n	j	qlts	pds	inr	j1j	cor1j	ctr1j	j2j	cor2j	ctr2j	j3j	cor3j	ctr3j
1	1986	1000	223	183	190	958	197	-28	23	69	13	4	26
2	1985	1000	187	135	171	882	133	-35	40	90	-48	71	302
3	1984	1000	166	17	10	20	0	44	428	118	47	479	251
4	1983	999	138	40	26	50	2	107	858	569	-26	53	67
5	1982	999	111	51	-127	779	45	-34	57	48	56	148	239
6	1981	1001	106	240	-315	955	258	-51	26	103	-7	1	5
7	1980	999	68	335	-468	969	365	9	0	2	-47	10	110
				1000			1000			1000			1000

	coordonnées négatives	coordonnées positives
axe 1	1980 (365) 1981 (258)	1986 (197)
axe 2	1981	1983 (569)
axe 3	néant	néant

le facteur F1	88.998	89 %
les facteurs F1 et F2	94.993	95 %
les facteurs F1, F2 et F3	98.158	98 %

I\ qlt	qlt1	qlt2	qlt3	J\ qlt	qlt1	qlt2	qlt3
USA	681	746	929	1986	958	981	985
Japon	988	996	1000	1985	882	922	993
RFA	891	989	994	1984	20	448	927
France	983	995	996	1983	50	908	961
GB	134	499	758	1982	779	836	984
Italie	798	869	871	1891	995	981	982
Pays Bas	144	715	720	1980	969	969	979
Suède	153	855	904
Suisse	627	630	995