Les documents XML du data registry
=====================================
Manipuldations générales
--------------------------
Rappel sur les XML valide et les XML bien formés
Le XML est **bien formé**
`xmllint --noout *.xml`
`find ./ -name "*.xml" -exec xmllint --noout {} \;`
Il reste à montrer qu'il est **valide** au regard des structures_ DTD de la TEI_.
.. _TEI: https://tei-c.org/Vault/P4/doc/html/DT.html
.. _structures: https://tei-c.org/Vault/P4/doc/html/ST.html
Balises de géo localisation
-----------------------------------
Concernant les informations de géolocalisation, soit l'acte a un lieu que l'on connaît et dans ce cas, à ce XPath `//tei:fileDesc//tei:sourceDesc`, il y a ce bloc :
.. code-block:: xml
Moulins (Château)
France
Allier
Moulins
Château des ducs de Bourbon
46.5664672 3.330838483573642
soit on ne connaît pas le lieu :
.. code-block:: xml
Castelnaud
NS
et enfin, lorsqu'il n'y a pas de lieu du tout :
.. code-block:: xml
NS
NS
----
FIXME : script de récupération des datas de géo localisation
pour follium le script que j'ai utilisé est un test, je ne sais pas si ça pourra nous re-servir puisque l'objectif final de ma manœuvre était d'intégrer des coordonnées géographiques aux XML. J'ai fait 4 étapes :
J'ai récupéré tous les lieux dans la balise et j'ai fait un set() pour éliminer les doublons. Le tout est intégrer à un CSV où une ligne = un lieu.
J'ai fait des interventions manuelles pour ajouter :
les départements et pays actuels ;
les dénominations actuelles des lieux (par ex Clermont qui est aujourd'hui Clermont-enBeauvaisis ou Sablé qui est Sablé-su-Sarthe)
Ensuite j'ai concaténer toutes ces informations dans une seule colonne, qui sert à interroger Nominatim et OpenStreetMap pour récupérer les coordonnées géographique + écrire le fichier html de la carte avec folium
Enfin j'ai envoyé toutes les informations de localisation (dont les coordonnées) dans les XML