Les documents XML du data registry ===================================== Manipuldations générales -------------------------- Rappel sur les XML valide et les XML bien formés Le XML est **bien formé** `xmllint --noout *.xml` `find ./ -name "*.xml" -exec xmllint --noout {} \;` Il reste à montrer qu'il est **valide** au regard des structures_ DTD de la TEI_. .. _TEI: https://tei-c.org/Vault/P4/doc/html/DT.html .. _structures: https://tei-c.org/Vault/P4/doc/html/ST.html Balises de géo localisation ----------------------------------- Concernant les informations de géolocalisation, soit l'acte a un lieu que l'on connaît et dans ce cas, à ce XPath `//tei:fileDesc//tei:sourceDesc`, il y a ce bloc : .. code-block:: xml Moulins (Château) France Allier Moulins Château des ducs de Bourbon 46.5664672 3.330838483573642 soit on ne connaît pas le lieu : .. code-block:: xml Castelnaud NS et enfin, lorsqu'il n'y a pas de lieu du tout : .. code-block:: xml NS NS ---- FIXME : script de récupération des datas de géo localisation pour follium le script que j'ai utilisé est un test, je ne sais pas si ça pourra nous re-servir puisque l'objectif final de ma manœuvre était d'intégrer des coordonnées géographiques aux XML. J'ai fait 4 étapes : J'ai récupéré tous les lieux dans la balise et j'ai fait un set() pour éliminer les doublons. Le tout est intégrer à un CSV où une ligne = un lieu. J'ai fait des interventions manuelles pour ajouter : les départements et pays actuels ; les dénominations actuelles des lieux (par ex Clermont qui est aujourd'hui Clermont-enBeauvaisis ou Sablé qui est Sablé-su-Sarthe) Ensuite j'ai concaténer toutes ces informations dans une seule colonne, qui sert à interroger Nominatim et OpenStreetMap pour récupérer les coordonnées géographique + écrire le fichier html de la carte avec folium Enfin j'ai envoyé toutes les informations de localisation (dont les coordonnées) dans les XML