add subtree data

main
gwen 3 years ago
parent 72646a5d79
commit 23ab07e3cd

@ -135,3 +135,58 @@ Identifiants
- L'identifiant des actes (`@xml:id` de `<TEI>`) est composé des trois éléments séparés d'un underscore et suivi de la date et d'une lettre.
- Actes de Charles Ier de Bourbon du 28 août 1427 : `brb_ch_i_1427_08_24a`.
Les datas dans le projet `princely-acts`
--------------------------------------------
Les datas dans le projet `princely-acts` sont centralisées dans un seul projet, le projet
.. glossary::
data registry
Un data registry est storage de data centralisé, qui fait office de référentiel de données. Ce référentiel peut être alors utilisé partout ailleurs dans les autres projets qui ont besoin d'utiliser les datas **en lecture**.
.. note:: Dans le projet `princely-acts`, le référentiel de données s'appelle `princely-acts/data` et est un dépôt git.
Pour réutilser les données par exemple dans le projet `princely-acts/datascience`, on peut :
- soit faire un lien symbolique si on est sous linux
- soit (cette pratique est préférable), utiliser la fonctionnalité
`git subtree <https://manpages.debian.org/bullseye/git-man/git-subtree.1.en.html>`_ de git, puisque nous utilisons git comme data registry.
Git subtree
----------------
Voici la procédure d'import des datas depuis le dépôt `princely-acts/data`
vers le dépot `princely-acts/datascience` par exemple :
- aller dans le dépôt `princely-acts/datascience`
- ajouter **à la racine du projet** le remote suivant :
::
datascience $ git remote add data git@gitlab.huma-num.fr:medieval-acts/princely-acts/data.git
- vérifiez que le remote a bien été ajouté avec la commande :
::
datascience $ git remote -v
data git@gitlab.huma-num.fr:medieval-acts/princely-acts/data.git (fetch)
data git@gitlab.huma-num.fr:medieval-acts/princely-acts/data.git (push)
origin git@gitlab.huma-num.fr:medieval-acts/datascience.git (fetch)
origin git@gitlab.huma-num.fr:medieval-acts/datascience.git (push)
- ensuite, vous pouvez ajouter le subtree qui va pointer sur les datas
avec la commande suivante (placez-vous toujours à la racine du projet)
::
datascience $ git subtree add --prefix actes-princiers/data/01_raw data main --squash
.. important:: Il faut que le dossier `actes-princiers/data/01_raw` n'existe pas (ne soint pas présent) dans le projet `datascience`, sinon le pull ne va fonctionner.
- Vous pouvez ensuite utiliser les datas du projet `data` depuis le projet `datascience`.

@ -54,6 +54,28 @@ Then install the latest `3.10` version like this::
Successfully installed pip-23.0.1 setuptools-65.5.0
Installed Python-3.10.12 to /home/gwen/.pyenv/versions/3.10.12
Verify the installation::
pyenv versions
* system
3.10.12
virtual environments list::
pyenv virtualenvs
pyenv local (in a folder) activation::
datascience (develop %=) $ pyenv local 3.10.12
datascience (develop %=) $ python
Python 3.10.12 (main, Aug 20 2023, 08:14:29) [GCC 12.2.0] on linux
Type "help", "copyright", "credits" or "license" for more information.
>>>
virtualenv creation::
datascience (develop %=) $ python -m venv .venv
pipenv and pdm
----------------

Loading…
Cancel
Save