samedi 27 février 2016

Histoire de l'informatique (les bases de données)

Nous publions ici un billet de 2008 paru sur un autre de nos blogs

Histoire de l'informatique (les bases de données)

  • Les fichiers (files en anglais):
Exemple : à la bibliothèque de l'iut nous avions trois fichiers : Titres, Auteurs, Matières. Ils étaient composés des mêmes enregistrements physiques (des cartons).
Mais l'un servait à répondre à la question "quelles sont les informations sur tel titre ? On pouvait avoir plusieurs exemplaires d'un même titre..."
L'autre à répondre à la question "quels sont les livres du fonds de la bibliothèque qui ont tels auteurs ?
...

On peut dire que chaque fichier implantait un chemin (file ... une file... voir définition d'un chemin, une suite) d'accès aux données.
Exemple :
Fichier Auteurs = (auteur (titre, matière (livre)))
Critiques :
- redondance des données
- non séparation entre structure de données et structure des programmes ...
D'où l'introduction du concept de base de données.
Une base de données est une relation, un ensemble de n-uplets. Mais dire cela, il a fallu longtemps aux informaticiens (à beaucoup d'informaticiens) pour oser le dire.
  • Le modèle hiérarchique de base de données. L'archétype fut IMS(avec le langage DL/1, Data language Oned'IBM, 1966D'aucuns expliquaient que le "monde était hiérarchique". Meyeret Baudouin s'en sont moqué dans leur livre Méthodes de programmation (Eyrolles)
Mais il fut un peu dépurifié (j'invente des termes, en informatique, on aime bien) avec des fils logiques et autres ficelles qui annonçaient ....
  • Le modèle réseau de Charles Bachman, Prix Turing 1973 avecIDS (qui était distribué en France par Bull) puis IDMS. Les diagrammes de Bachman permettait de modéliser. Un "set" était représenté par une flèche. En fait, l'inverse de la flèche était une fonction (mais chut, ça c'est de la mathématique de mat sup(maternelle supérieure i.e. grande section). Les sets (des ensembles de couples en fait) étaient implantés par des anneaux. En on les parcourait avec des ordres comme nextfirstlast ...On pouvait aussi les trier. Bachman intitula son discours de réception du Prix Turing : le programmeur naviguant. Le "monde était maintenant un réseau".
  • Enfin, ouf... Codd publia en 1970 son article "A Relational Modelof Data...". Il dut se bagarrer au sein d'IBM qui vendait IMS. On lui a dit "c'est de la théorie". Codd répondit "la bombe atomique c'est aussi de la théorie"... En1981, il obtenait le Prix Turing.
Notons qu'en 1974 J.RAbrial publiait son article "Data Semantics". C'était les débuts de Z. B allait naître dans les années 80.
P. Chen a publié son papier sur le "modèle Entité Association" en 1976. Ce n'allait pas éclaircir les choses. Mais introduire des années deboxologie et de confusions. Et de blablaware.
J.DWarnier (de Bull) a publié LCS à la fin des années 60 . Il faisait du "modèle relationnel" avec du vocabulaire de maths français (au lieu de parler de fonction totale, il parlait d'application.) Il proposait en plus une structuration en utilisant les concepts de client et de fournisseur.
Aujourd'hui, 38 ans après, les étudiants pensent que Maille Est-Ce Cul Elle c'est le fin du fin de l'informatique... Comme quoi la théorie des ensembles et des relations ....
  • Puis il y a eu les BDD (Bases de Données Déductives), à ne pas confondre avec les BDD (Binary Decision Diagrams) utilisés par les model-checkers (voir notre module Spec2). Une base de données, ensemble de n-uplets. Un n-uplet est une proposition. En Prolog, on dit "un fait". De faits, on peut déduire via des règles, d'autres faits. Par exemple du fait que a est père de b et du fait que b est père de c, on peut déduire que a est grand père de c. Il n'est pas alors besoin de stocker ce dernier fait. Il est déductible. On pourrait le "déduire" en utilisant un algo. MaisAlain Colmerauer a eu l'idée d'utiliser une méthode de logique (merci Robinson, voir votre cours de logique) pour faire cette déduction. Le programmeur n'a rien à écrire. On coupla donc des bases de données à Prolog. Mais finalement ...voir aujourd'hui
  • Puis bien sûr, on ne pouvait manquer "les BDO" bases de données objet. Le problème c'est qu'on n'a jamais eu une théorie au point.... Et qu'en est-il aujourd'hui des BDO. La France avait pourtant bien investi avec son système O2.

Et ensuite on nous a dit HTML c'est le langage ultime ! Et pourquoi pasl'ASCII ? On retrouve "le modèle hiérarchique". On recommence ... Mais petit à petit on va arriver au relationnel. Je vous le dis, observez bien.

Bof, bof, bof. En informatique ce qui a été publié il y a plus de 5 ans c'est nul. Alors chercheurs, un conseil, recopiez les vieux articles et surtout mettez du virtuel partout. Virtualisation est le terme à la mode chez lesDSI.


P.S.

Les mots à la mode en informatique (histoire)
  • Structuré
  • Relationnel
  • Objet
et maintenant Virtuel

1 commentaire:

Carole a dit…

A propos de bases de données... mon fils est le concepteur de "Keras", une sorte de bibliothèque de données "open source" en intelligence artificielle. Il est convaincu que l'avenir est au partage des données et des recherches. J'explique sans doute très mal... mais je pense que cela pourrait vous intéresser. Cela s'appelle "Keras" et c'est ici : https://github.com/fchollet/keras

 
Site Meter