Manquement de paragraphes dû aux versionnage de sections #11

tianyikillua · 2016-12-25T14:32:00Z

Parfois le fichier obtenu manque quelques paragraphes dans certaines sections : cela vient du fait que les modifications chronologiques des sections deviennent trop complexes...

LEGISCT1 -> Chapitre I ancien
LEGISCT2 -> Chapitre I nouveau
LEGISCT3 -> Section 1, dont le id_parent est LEGISCT1, mais en vigueur dans la nouvelle version

Dans cette configuration, Section 1 disparaît dans la nouvelle version.

Je n'ai pas encore tout à fait compris votre base de données, mais le workaround que j'ai trouvé, au lieu de faire

articles_section = articles.select().where(Article.version_section == version_section_parente)

est de prendre maintenant toutes les possibilités

articles_section = articles.select().where( (Article.version_section == version_section_parente.cid.cid) | (Article.version_section == version_section_parente))

Idem pour les sections, dans le fichier exporter.py.

The text was updated successfully, but these errors were encountered:

C'est un peu moche mais je ne connais pas trop les manip sql

…igin/date_fond', 'origin/improve-markdown' and 'origin/mises-a-jour-des-scripts'

Le format de sortie est géré par différentes abstractions permettant de générer différents formats de sortie tout en dissociant bien le code interne : * syntaxe utilisée : Markdown, etc. * organisation des fichiers : un fichier unique, un article par fichier (sans répertoires), etc. * versionnement : Git, etc. (#35) Pour chaque abstraction, une "interface" est proposée. Étant donné l’ampleur du changement, il est possible que ces interfaces évoluent dans les semaines qui viennent. Au passage, un cache de sections (#32) est implémenté pour éviter de recalculer (récursivement) les sous-sections. La difficulté est de repérer (récursivement) la plus proche date interne de fin de vigueur, ce qui est fait en retournant ce résultat avec le texte de la section pour invalider toutes les sections parentes au-delà de cette date de fin de vigueur. Le gain de temps de calcul est environ 30 à 100 (pifométriquement, ça passe d’heures de calcul à minutes de calcul). Avec le travail sur le cache de sections a été vérifié de façon plus fine différentes exceptions sur les dates de vigueur. Entre autres, l’exception où la date de début de vigueur est 2999-01-01 (=absence de date) notamment utilisée dans les arrêtés. Cela pourrait corriger #11 et #30.

Performance ----------- Plutôt que de faire 1+N requêtes SQL par section (1 pour obtenir ses sous-sections à la date de vigueur + N pour obtenir les titres de sous-sections), une requête globale à tout un texte est faite comprenant toutes les sections et sous-sections et une jointure pour obtenir les titres. Le temps de démarrage est donc plus long mais la suite est beaucoup plus rapide. Articles manquants ------------------ Lorsque ce n’est pas imputable à la base LEGI elle-même (cf #30), certains articles (ou sections ?) manquent du fait du code et/ou du mécanisme de cache et/ou de la structure de données pas assez comprise. Par exemple, si une section a une plage de vigueur 2000-01-01 – infini et une sous-section 2010-01-01 – 2011-01-01, le cache doit expirer en 2000-01-01, 2010-01-01, 2011-01-01, c’est-à-dire prendre en compte les dates de début et fin de vigueur des sous-sections : pour calculer la plus prochaine date d’expiration du cache d’une section, il faut donc lister ses sous-sections et donc les connaître, y compris celles qui ne sont pas encore en vigueur, c’est l’objet de cette généralisation de la requête SQL (en plus de l’aspect performances). Noter qu’il manque encore des articles, il faut rechercher à qui cela est imputable (code, cache, mauvaise compréhension du schéma de données de la base LEGI, base LEGI elle-même). Une amélioration possible serait que le cache de sections ne soit pas un simple dictionnaire (avec comme clé l’identifiant LEGISCTA), mais une structure arborescente. Cela faciliterait la lecture, mais il faut trouver une méthode efficace de créer cette structure. Bug: #11 #30

Ce manque correspond au cas où un article est rattaché à plusieurs sections parentes, lorsque la section parente change de titre. Issue: #11

Seb35 · 2018-05-27T21:53:47Z

La situation est beaucoup améliorée depuis le commit 367d633, cela corrige les exemples du "Chapitre III : La carte de séjour temporaire et la carte de séjour pluriannuelle" du CESEDA (qui était vide), la section "Chapitre VII : Sanctions prononcées par la formation restreinte de la Commission nationale de l'informatique et des libertés." de la loi 78-17 (qui était vide) et certains cas où le texte du CPI n’était nullement modifié d’une version à l’autre.

Il reste toutefois 3 versions du CPI où le texte n’est pas modifié n’est pas modifié d’une version à l’autre, ce qui n’est pas normal (2008-06-29, 2011-05-29, 2017-12-22).

Seb35 · 2018-08-10T12:40:51Z

Bon, sur les trois versions manquantes du CPI

deux sont normales (2008-06-29, 2017-12-22) car ce ne sont des articles morts-nés (entrée en vigueur future, mais ils ont été abrogés avant même leur entrée en vigueur)
pour 2011-05-29, il s’agit d’une erreur dans la base LEGI également présente sur Légifrance, et ce n’est donc pas une erreur dans Archéo Lex ou legi.py - voir le détail sur Nouveau type d’anomalie : date de début de vigueur avant la date de début de vigueur de la section legi.py#40

Je ferme ce bug puisque je ne constate plus de problème. Si d’autres problèmes similaires sont trouvés, il vaudrait mieux ouvrir un nouveau bug. Dans ce cas, décrire précisément le problème (noms du code, de la section, de l’article, date à laquelle ça arrive).

tianyikillua added a commit to tianyikillua/Archeo-Lex that referenced this issue Dec 25, 2016

Possible fix of Legilibre#11

d0de7db

tianyikillua added a commit to tianyikillua/Archeo-Lex that referenced this issue Dec 25, 2016

Possible fix of Legilibre#11

55691be

tianyikillua added a commit to tianyikillua/Archeo-Lex that referenced this issue Dec 25, 2016

Possible fix of Legilibre#11

07823e5

C'est un peu moche mais je ne connais pas trop les manip sql

tianyikillua referenced this issue in tianyikillua/Archeo-Lex Dec 28, 2016

Merge remote-tracking branches 'origin/fix-#3', 'origin/fix-#11', 'or…

40d83dd

…igin/date_fond', 'origin/improve-markdown' and 'origin/mises-a-jour-des-scripts'

Seb35 added the bug label Feb 5, 2017

Seb35 mentioned this issue Mar 20, 2017

Utiliser legi.py comme base de données #31

Closed

Seb35 added a commit that referenced this issue May 27, 2018

Correction : certains articles manquaient

367d633

Ce manque correspond au cas où un article est rattaché à plusieurs sections parentes, lorsque la section parente change de titre. Issue: #11

Seb35 closed this as completed Aug 10, 2018

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Manquement de paragraphes dû aux versionnage de sections #11

Manquement de paragraphes dû aux versionnage de sections #11

tianyikillua commented Dec 25, 2016

Seb35 commented May 27, 2018

Uh oh!

Seb35 commented Aug 10, 2018

Uh oh!

Manquement de paragraphes dû aux versionnage de sections #11

Manquement de paragraphes dû aux versionnage de sections #11

Comments

tianyikillua commented Dec 25, 2016

Seb35 commented May 27, 2018

Uh oh!

Seb35 commented Aug 10, 2018

Uh oh!