Les datas dans le projet `princely-acts` sont centralisées dans un seul projet, le projet
Les datas dans le projet `princely-acts` sont centralisées dans un seul projet, le projet nommé `data`.
..glossary::
..glossary::
@ -150,12 +150,14 @@ Les datas dans le projet `princely-acts` sont centralisées dans un seul projet,
..note:: Dans le projet `princely-acts`, le référentiel de données s'appelle `princely-acts/data` et est un dépôt git.
..note:: Dans le projet `princely-acts`, le référentiel de données s'appelle `princely-acts/data` et est un dépôt git.
Ce projet `data`**est la seule et unique source des datas**.
Pour réutilser les données par exemple dans le projet `princely-acts/datascience`, on peut :
..important:: Ne jamais dupliquer les datas ! Elles sont dans un seul
et unique data registry.
- soit faire un lien symbolique si on est sous linux
Pour réutilser les données **sans les dupliquer**, par exemple dans le projet `princely-acts/datascience`, il est proposé d'utiliser
- soit (cette pratique est préférable), utiliser la fonctionnalité
la fonctionnalité
`git subtree <https://manpages.debian.org/bullseye/git-man/git-subtree.1.en.html>`_ de git, puisque nous utilisons git comme data registry.
`git subtree <https://manpages.debian.org/bullseye/git-man/git-subtree.1.en.html>`_ de git, puisque le choix a été fait d'utiliser git comme data registry.
Git subtree
Git subtree
----------------
----------------
@ -189,4 +191,19 @@ vers le dépot `princely-acts/datascience` par exemple :
..important:: Il faut que le dossier `actes-princiers/data/01_raw` n'existe pas (ne soint pas présent) dans le projet `datascience`, sinon le pull ne va fonctionner.
..important:: Il faut que le dossier `actes-princiers/data/01_raw` n'existe pas (ne soint pas présent) dans le projet `datascience`, sinon le pull ne va fonctionner.
..note:: l'option `--squash` permet de ne pas ajouter l'historique du projet `data` au projet `datascience`
- Vous pouvez ensuite utiliser les datas du projet `data` depuis le projet `datascience`.
- Vous pouvez ensuite utiliser les datas du projet `data` depuis le projet `datascience`.
Data update
------------
Si une nouvelle version des datas a été releasée, pour récupérer ces datas depuis le projet `datascience`, lancer cette commande **à la racine du projet** :
::
git subtree pull --prefix actes-princiers/data/01_raw data main --squash
X11 forwarding request failed on channel 0
Depuis gitlab.huma-num.fr:medieval-acts/princely-acts/data