From 0d9aa78f9ce0d91fbc33db4243854a0f0dc9ef57 Mon Sep 17 00:00:00 2001 From: gwen Date: Sat, 26 Aug 2023 17:37:48 +0200 Subject: [PATCH] =?UTF-8?q?data=20xml=20:=20g=C3=A9o=20localisation?= MIME-Version: 1.0 Content-Type: text/plain; charset=UTF-8 Content-Transfer-Encoding: 8bit --- source/xml.rst | 72 +++++++++++++++++++++++++++++++++++++++++++++++--- 1 file changed, 68 insertions(+), 4 deletions(-) diff --git a/source/xml.rst b/source/xml.rst index 2c8db48..9cb99d3 100644 --- a/source/xml.rst +++ b/source/xml.rst @@ -1,8 +1,10 @@ -Manipuldations générales sur les documents XML -=================================================== +Les documents XML du data registry +===================================== -XML valide et XML bien formé --------------------------------- +Manipuldations générales +-------------------------- + +Rappel sur les XML valide et les XML bien formés Le XML est **bien formé** @@ -15,3 +17,65 @@ Il reste à montrer qu'il est **valide** au regard des structures_ DTD de la TEI .. _TEI: https://tei-c.org/Vault/P4/doc/html/DT.html .. _structures: https://tei-c.org/Vault/P4/doc/html/ST.html +Balises de géo localisation +----------------------------------- + + +Concernant les informations de géolocalisation, soit l'acte a un lieu que l'on connaît et dans ce cas, à ce XPath `//tei:fileDesc//tei:sourceDesc`, il y a ce bloc : + +.. code-block:: xml + + + + + Moulins (Château) + + France + Allier + Moulins + Château des ducs de Bourbon + 46.5664672 3.330838483573642 + + + + + +soit on ne connaît pas le lieu : + +.. code-block:: xml + + + + Castelnaud + + NS + + + + +et enfin, lorsqu'il n'y a pas de lieu du tout : + +.. code-block:: xml + + + + NS + + NS + + + + + +---- + +FIXME : script de récupération des datas de géo localisation + +pour follium le script que j'ai utilisé est un test, je ne sais pas si ça pourra nous re-servir puisque l'objectif final de ma manœuvre était d'intégrer des coordonnées géographiques aux XML. J'ai fait 4 étapes : + +J'ai récupéré tous les lieux dans la balise et j'ai fait un set() pour éliminer les doublons. Le tout est intégrer à un CSV où une ligne = un lieu. +J'ai fait des interventions manuelles pour ajouter : +les départements et pays actuels ; +les dénominations actuelles des lieux (par ex Clermont qui est aujourd'hui Clermont-enBeauvaisis ou Sablé qui est Sablé-su-Sarthe) +Ensuite j'ai concaténer toutes ces informations dans une seule colonne, qui sert à interroger Nominatim et OpenStreetMap pour récupérer les coordonnées géographique + écrire le fichier html de la carte avec folium +Enfin j'ai envoyé toutes les informations de localisation (dont les coordonnées) dans les XML