BWB XML-parser: formele wetten #6
Labels
No labels
component:ai
component:api
component:cli
component:frontend
component:pipeline
prio:critical
type:docs
type:feature
type:infra
type:research
type:task
No milestone
No project
No assignees
1 participant
Notifications
Due date
No due date set.
Dependencies
No dependencies set.
Reference: wetgit/meta#6
Loading…
Add table
Reference in a new issue
No description provided.
Delete branch "%!s()"
Deleting a branch is permanent. Although the deleted branch may continue to exist for a short time before it actually gets removed, it CANNOT be undone in most cases. Continue?
Beschrijving
Bouw een parser die BWB toestand-XML (schema versie 2015-2) omzet naar Markdown + YAML frontmatter voor formele wetten.
Scope
<wetgeving>root elementEdge cases
Technische keuzes
lxmlvoor XML-parsing (XPath/XSLT)Blocked by
Update: Niet langer geblokkeerd door #3. BWB data is publiek beschikbaar via de repository () en SRU-interface. Kan direct gestart worden.
BWB Data-toegang gevalideerd (2026-03-29)
SRU-endpoint (publiek, geen authenticatie):
Geeft 23.971 wetten terug met metadata (titel, type, ministerie, datum) en download-URLs.
Repository (publiek, directe download):
Metadata (WTI):
Beide endpoints getest en werkend. De Stelselwet uit 1821 is succesvol gedownload (88 KB XML).
Aanbevolen aanpak:
Pipeline v0.1 werkend
Drie nieuwe modules:
sru_client.py— SRU catalogus crawlerdownloader.py— XML downloader met cachingrunner.py— Pipeline orchestratie met CLITest: 28 wetten geparsed
500 SRU records → 27 unieke wetten → 28 Markdown bestanden (incl. cached), 0 failures.
Mappenstructuur
Nog te doen voor volledige Fase 1
wet)Pipeline voltooid — volledige rijksregelgeving geparsed
Per type
Data is gepusht naar
wetgit/rijkrepo.