You cannot select more than 25 topics
Topics must start with a letter or number, can include dashes ('-') and can be up to 35 characters long.
82 lines
2.8 KiB
ReStructuredText
82 lines
2.8 KiB
ReStructuredText
Les documents XML du data registry
|
|
=====================================
|
|
|
|
Manipuldations générales
|
|
--------------------------
|
|
|
|
Rappel sur les XML valide et les XML bien formés
|
|
|
|
Le XML est **bien formé**
|
|
|
|
`xmllint --noout *.xml`
|
|
|
|
`find ./ -name "*.xml" -exec xmllint --noout {} \;`
|
|
|
|
Il reste à montrer qu'il est **valide** au regard des structures_ DTD de la TEI_.
|
|
|
|
.. _TEI: https://tei-c.org/Vault/P4/doc/html/DT.html
|
|
.. _structures: https://tei-c.org/Vault/P4/doc/html/ST.html
|
|
|
|
Balises de géo localisation
|
|
-----------------------------------
|
|
|
|
|
|
Concernant les informations de géolocalisation, soit l'acte a un lieu que l'on connaît et dans ce cas, à ce XPath `//tei:fileDesc//tei:sourceDesc`, il y a ce bloc :
|
|
|
|
.. code-block:: xml
|
|
|
|
<sourceDesc>
|
|
<listPlace>
|
|
<place>
|
|
<placeName>Moulins (Château)</placeName>
|
|
<location>
|
|
<country>France</country>
|
|
<region>Allier</region>
|
|
<settlement>Moulins</settlement>
|
|
<district>Château des ducs de Bourbon</district> <!-- optionnel, uniquement si le lieu est un bâtiment dans une ville-->
|
|
<geo>46.5664672 3.330838483573642</geo>
|
|
</location>
|
|
</place>
|
|
</listPlace>
|
|
</sourceDesc>
|
|
|
|
soit on ne connaît pas le lieu :
|
|
|
|
.. code-block:: xml
|
|
|
|
<listPlace>
|
|
<place>
|
|
<placeName>Castelnaud</placeName>
|
|
<location>
|
|
<settlement>NS</settlement>
|
|
</location>
|
|
</place>
|
|
</listPlace>
|
|
|
|
et enfin, lorsqu'il n'y a pas de lieu du tout :
|
|
|
|
.. code-block:: xml
|
|
|
|
<listPlace>
|
|
<place>
|
|
<placeName>NS</placeName>
|
|
<location>
|
|
<settlement>NS</settlement>
|
|
</location>
|
|
</place>
|
|
</listPlace>
|
|
|
|
|
|
----
|
|
|
|
FIXME : script de récupération des datas de géo localisation
|
|
|
|
pour follium le script que j'ai utilisé est un test, je ne sais pas si ça pourra nous re-servir puisque l'objectif final de ma manœuvre était d'intégrer des coordonnées géographiques aux XML. J'ai fait 4 étapes :
|
|
|
|
J'ai récupéré tous les lieux dans la balise <placeName> et j'ai fait un set() pour éliminer les doublons. Le tout est intégrer à un CSV où une ligne = un lieu.
|
|
J'ai fait des interventions manuelles pour ajouter :
|
|
les départements et pays actuels ;
|
|
les dénominations actuelles des lieux (par ex Clermont qui est aujourd'hui Clermont-enBeauvaisis ou Sablé qui est Sablé-su-Sarthe)
|
|
Ensuite j'ai concaténer toutes ces informations dans une seule colonne, qui sert à interroger Nominatim et OpenStreetMap pour récupérer les coordonnées géographique + écrire le fichier html de la carte avec folium
|
|
Enfin j'ai envoyé toutes les informations de localisation (dont les coordonnées) dans les XML
|