Résumé
La méthode des gradients conjugués (Hestenes & Stiefel, 1952) fut spécialement conçue pour la résolution des matrices symétriques définies positives. Elle présente la propriété remarquable d’avoir la structure d’une méthode itérative et d’être en même temps une méthode d’élimination (convergence de principe en n itérations, n étant le nombre de valeurs propres différentes du système).
Cette méthode ne semble pasavoir eu tout le succès pratique que l’on aurait pu espérer, sans doute parce que, dans le cas de très grands systèmes, les erreurs d’arrondis viennent perturber les prévisions mathématiques, au point de rendre parfois la méthode non convergente.
Elle n’en reste pas moins riche de promesses, et l’étude de méthodes aptes à éviter les conséquences des erreurs d’arrondis n’est certainement pas achevée.
Dans l’article qui va suivre, nous avons essayé de généraliser les idées qui ont conduit à la théorie des gradients. Les algorithmes qui sont présentés ont les caractéristiques suivantes;
-
-Ils correspondent à des méthodes semi-itératives, c’est-à-dire convergentes en un nombre fini d’itérations.
-
-Ils correspondent, à chaque étape, à la diminution d’une norme définie positive, en généralune somme des carrés des résidues, norme facile à contrôler et qui peut servir de critère fondamental pour la validité d’une solution.
-
-Ils sont différenciés, adaptés à des matrices définies positives ou non, symétriques ou non.
-
-Ils se confondent avec l’algorithme dit des “résidues conjugués” quand la matrice traitée est symétrique définie positive.
Nous ne savons pas si toutes ces méthodes s’imposeront dans la pratique, mais il nous a semblé important de montrer comment on pouvait les déduire d’un algorithme fondamental. On attire particulièrement l’attention sur le rapprochement (effectué en Annexe 2) entre la théorie des matrices symétriques et celle des polygones orthogonaux, avec une fonction de poids reliée à la distribution λ (x) des valeurs propres.
Summary
The method of conjugate gradients (Hestenes & Stiefel, 1952) was originally especially designed for solving symmetric positive matrices. This method has the following outstanding property: it has the structure of an iterative process and it is also an elimination method (theoretical convergence in n steps, n being the number of different eigenvalues of the matrix).
The practical success of this method, till now, has not been as important as one could expect, probably because, for big systems of equations, rounding off errors occur, which may eventually completely modify the mathematical predictions.
The method seems however to be very promising, if one takes account of the fact that all practical methods of avoiding rounding off errors have not yet been investigated.
In the following article, we have tried to give a generalization of the theory of conjugate gradients. The given algorithms have the following characteristics:
-
-They define semi-iterative methods, i.e. leading to the mathematical solution after a finite number of steps.
-
-They correspond, at each step, to a decrease of a positive norm, in generalthe sum of squares of the residuals, which is practically the best criterion to check the final solution.
-
-There is a special algorithm for each case: positive or non positive matrices, symmetric or not.
-
-When the concerned matrix is symmetric and positive, each algorithm gives back the method of “conjugate residuals”.
We are not sure that these different methods will be all of practical use, but it seems important to show how they derive from a basic algorithm. Special attention should be given to the analogy (see Annex 2) between the theory of symmetric matrices and that of orthogonal polynomials P (x), with a weight function connected with the distribution λ (x) of eigenvalues.
Article PDF
Avoid common mistakes on your manuscript.
Author information
Authors and Affiliations
Rights and permissions
About this article
Cite this article
Dufour, H.M., Burette, D. Presentation synthetique des methodes semi-iteratives de resolution des systemes lineaires. Bull. Geodesique 113, 267–306 (1974). https://doi.org/10.1007/BF02521916
Published:
Issue Date:
DOI: https://doi.org/10.1007/BF02521916