Την τελευταία δεκαετία, υπάρχει αυξημένο ενδιαφέρον για τη δημοσίευση κυβερνητικών δεδομένων, έτσι ώστε να είναι ανοιχτά και εύκολα προσβάσιμα από το ευρύ κοινό. Οι τεχνολογικές εξελίξεις στην περιοχή του σημασιολογικού ιστού έχουν προκαλέσει την ανάπτυξη του λεγόμενου “Ιστού των δεδομένων” (Web of Data), η οποία έδωσε μια ακόμα ισχυρότερη ώθηση σε αυτές τις προσπάθειες. Πρόσφατα, εξελίξεις στην περιοχή της επεξεργασίας φυσικής γλώσσας μέσω της χρήση τεχνικών όπως το deep learning παρέχουν τεχνολογίες οι οποίες επιτρέπουν την επιτυχή επεξεργασία και εξόρυξη πληροφορίας από δεδομένα κειμένου.

Ένα σημαντικό είδος κυβερνητικών δεδομένων είναι τα δεδομένα που σχετίζονται με τη νομοθεσία. Η νομοθεσία άπτεται της κάθε πτυχής της κοινωνίας και εξελίσσεται συνεχώς, οικοδομώντας ένα τεράστιο δίκτυο διασυνδεδεμένων νομικών εγγράφων. Συνεπώς, είναι σημαντικό για μια κυβέρνηση να προσφέρει υπηρεσίες οι οποίες κάνουν τη νομοθεσία εύκολα προσβάσιμη στο κοινό, σκοπεύοντας να το πληροφορήσει, δίνοντας του τη δυνατότητα να υπερασπιστεί τα δικαιώματά του, ή ακόμα και να χρησιμοποιήσει τη νομοθεσία ως μέρος της δουλειάς του. Προς αυτή την κατεύθυνση, πολλές χώρες της Ευρωπαϊκής Ένωσης (Ε.Ε.) έχουν ήδη αυτοματοποιήσει τη διαδικασία ψηφιοποίησης αναπτύσσοντας πλατφόρμες για την αποθήκευση νομικών εγγράφων, προσφέροντας παράλληλα on-line πρόσβαση σε αυτά.

Τα πρότυπα του σημασιολογικού ιστού, όπως είναι τα Resource Description Framework (RDF) και Web Ontology Language (OWL) διευκολύνουν τον διαχωρισμό μεταξύ περιεχομένου, την παρουσίαση και τα μεταδεδομένα, συμβάλλοντας έτσι στην καλύτερη αξιοποίηση των πληροφοριών που περιέχονται στα έγγραφα αυτά. Μια δημοφιλής μορφή και λεξιλόγιο που χρησιμοποιείται για την κωδικοποίηση της δομής και του περιεχομένου των νομικών και βοηθητικών εγγράφων είναι το ELI, πρωτοβουλία της Ευρωπαικής Επιτροπής για την τυποποίηση της μορφής που παρέχεται η νομοθεσία. Το ELI χρησιμεύει ως μία RDF μορφή ανταλλαγής δεδομένων, αλλά πρόσφατα μια πανομοιότυπη οντολογία έχει κάνει την εμφάνισή της (http://publications.europa.eu/mdr/resource/eli/eli.owl), η οποία εκφράζεται στην γλώσσα OWL και χρησιμοποιείται ως ένα λεξιλόγιο για την έκφραση των μεταδεδομένων των νομικών εγγράφων.

Στην Ελλάδα, εξακολουθεί να υπάρχει πολύ περιορισμένος βαθμός μηχανοργάνωσης γύρω από τη νομοθετική διαδικασία, ώστε ακόμα και η εύρεση της νομοθεσίας που σχετίζεται με ένα συγκεκριμένο θέμα μπορεί να είναι αρκετά δύσκολη. Ένας πρόσφατος νόμος και το πρόγραμμα του, που ονομάζεται Di@vgeia (https://diavgeia.gov.gr/), προσπάθησε να διορθώσει αυτή την κατάσταση υποχρεώνοντας όλα τα κυβερνητικά όργανα να ανεβάζουν τις πράξεις και τις αποφάσεις τους στον Ιστό. Η Di@vgeia προσφέρει τις βασικές λειτουργίες αναζήτησης, χρησιμοποιώντας λέξεις-κλειδιά σχετικά με το περιεχόμενο των νομικών εγγράφων και των μεταδεδομένων τους, καθώς και μια υπηρεσία που παρέχει στους προγραμματιστές τη δυνατότητα να ψάχνουν αυτή τη συλλογή των εγγράφων που βασίζονται σε κάποιες προεπιλεγμένες πληροφορίες μεταδεδομένων. Η συγκεκριμένη υπηρεσία, καθώς και άλλες κρατικές web υπηρεσίες, όπως το site του Εθνικού Τυπογραφείου (http://www.et.gr), δεν αναλύουν/κωδικικοποιούν το νομικό κείμενο με σκοπό την αξιοποίηση της πληροφορίας.

Σε αυτό το έργο, ακολουθούμε τα βήματα των άλλων επιτυχημένων προσπαθειών στην Ευρώπη που αποσκοπούν στον εκσυγχρονισμό του τρόπου με τον οποίο το νομοθετικό έργο προσφέρεται στο κοινό. Ταυτιζόμενοι με τους στόχους της πλατφόρμας Di@vgeia, οραματιζόμαστε μια νέα κατάσταση πραγμάτων στην οποία οι άνθρωποι θα έχουν στη διάθεσή τους προηγμένες δυνατότητες αναζήτησης σχετικά με το περιεχόμενο του νομοθετικού έργου. Οραματιζόμαστε ένα παράδειγμα της διάθεσης του νομοθετικού έργου κατά τρόπο που οι προγραμματιστές θα μπορούν να το χρησιμοποιούν, έτσι ώστε να μπορεί να συνδυάζεται και με άλλα ανοιχτά δεδομένα ώστε να αυξηθεί η αξία του προς το δημόσιο συμφέρον. Από όσα γνωρίζουμε, δεν υπάρχει καμία άλλη προσπάθεια στην Ελλάδα που λαμβάνει αυτή την προοπτική σχετικά με τη νομοθεσία και τις σχετικές αποφάσεις που λαμβάνονται τόσο από τα κυβερνητικά, όσο και από τα διοικητικά όργανα.

Αντιλαμβανόμαστε τη νομοθεσία ως μια συλλογή νομικών εγγράφων με μια τυπική δομή. Νομικά έγγραφα μπορούν να συνδεθούν από την άποψη των τροποποιήσεων με αναφορές και σε άλλα έγγραφα, γεγονός που αντανακλά την πλούσια σημασιολογική πληροφορία και τις αλληλεξαρτήσεις μεταξύ των εγγράφων. Μια σύγχρονη χώρα χρειάζεται ευφυείς υπηρεσίες που παρουσιάζουν όχι μόνο την μορφή κειμένου που περιέχουν τα νομικά έγγραφα, αλλά είναι σε θέση να απαντήσουν σε σύνθετα ερωτήματα όπως «Ποια νομικά έγγραφα έχει υπογράψει κάποιος συγκεκριμένος υπουργός, κατά τη διάρκεια της θητείας του ως υπουργός Οικονομικών;“, “Ποια νομικά έγγραφα έχουν τροποποιηθεί και από ποιον;” ή “Ανέκτησε τα 10 πιο συχνά τροποποιημένα νομικά έγγραφα μεταξύ 2008-2013". Για να ενεργοποιήσουμε τη διαμόρφωση και την απάντηση τέτοιων πολύπλοκων ερωτημάτων, έχουμε σχεδιάσει και αναπτύξει μια πρωτότυπη διαδικτυακή εφαρμογή, που ονομάζεται Νομοθεσί@, η οποία προσφέρει την ελληνική νομοθεσία σε RDF, όπως αυτή δημοσιεύεται στην Εφημερίδα της Κυβερνήσεως. Η ελληνική νομοθεσία έχει μοντελοποιηθεί στη Νομοθεσί@ σύμφωνα με μία OWL οντολογία που επαναχρησιμοποιεί την οντολογία του ELI και την επεκτείνει όπου χρειάζεται, για να συλλάβει τις ιδιαιτερότητες της ελληνικής νομοθεσίας. Η Νομοθεσί@ προσφέρει προηγμένες υπηρεσίες παρουσίασης και λειτουργιών αναζήτησης στα μεταδεδομένα και το περιεχόμενο του κειμένου της ελληνικής νομοθεσίας. Ένα σημαντικό χαρακτηριστικό της Νομοθεσί@ είναι ότι προσφέρει ένα endpoint επερωτήσεων SPARQL και μια RESTful υπηρεσία που μπορεί να αξιοποιηθεί από τους προγραμματιστές για την κατανάλωση του περιεχομένου του έργου και αυτό να συνδυαστεί με άλλα ανοιχτά δεδομένα. Από την άποψη αυτή, η Νομοθεσί@ ανοίγει μια ολόκληρη νέα αγορά που μπορούν να αναπτυχθούν υπηρεσίες με βάση τις τεχνολογίες του Σημασιολογικού Ιστού με άμεσα κοινωνικά οφέλη και μεγάλες επιχειρηματικές ευκαιρίες.

Η Νομοθεσί@ παρέχει ανοιχτή πρόσβαση σε μια συλλογή με πάνω από 12.000 νομοθετικά έργα, διασυνδεδεμένα με περίπου 124.400 συνδέσεις και παραπάνω από 8.000 μοναδικές οντότητες, όπως γεωπολιτικές οντότητες, πρόσωπα, οργανισμούς και γεωγραφικά σημεία αναφοράς (σημεία ενδιαφέροντος).


Η ελληνική νομοθεσία δημοσιεύεται μέσω των διαφορετικών τύπων των εγγράφων ο οποίος προέρχεται από τα μέλη της κυβέρνησης που το δημιούργησαν βάσει μιας ειδικής νομοθετικής διαδικασίας. Έχει μια τυποποιημένη δομή μετά από την κατάλληλη κωδικοποίηση, η οποία μπορεί να αναμορφωθεί σύμφωνα με μεταγενέστερες τροποποιήσεις.

Δομή Της Ελληνικής Νομοθεσίας

Υπάρχουν πέντε κύριες πηγές της ελληνικής νομοθεσίας που εξετάζουμε σε αυτό το έργο: σύνταγμα, προεδρικά διατάγματα, νόμους, πράξεις υπουργικού συμβουλίου, και υπουργικές αποφάσεις. Αυτές οι πηγές της νομοθεσίας μετουσιώνονται σε νομικά έγγραφα, τα οποία κωδικοποιούνται ακολουθώντας ειδικές προδιαγραφές. Η νομοθεσία είναι μια διαδικασία επηρεαζόμενη από την επέλευση γεγονότων. Τα νομικά έγγραφα που δημοσιεύονται στην Εφημερίδα της Κυβερνήσεως, μπορούν να τροποποιηθούν από μεταγενέστερα νομικά έγγραφα όσον αφορά το περιεχόμενο με τη μορφή τροποποιήσεων, και τελικά να παύσει η ισχύς τους. Κατά τη διάρκεια αυτής της διαδικασίας, θα πρέπει να συλλάβουμε τη δομική πληροφορία της νομοθεσίας και την εξέλιξη του περιεχομένου της μέσα στο χρόνο, που δίνεται από τις νομοθετικές τροποποιήσεις που εφαρμόζονται στο πρωτογενές νομικό έγγραφο.

Κωδικοποίηση Της Ελληνικής Νομοθεσίας

Σήμερα, η κωδικοποίηση της ελληνικής νομοθεσίας ακολουθεί τους κανόνες που ορίζονται στο "Εγχειρίδιο οδηγιών για την κωδικοποίηση της νομοθεσίας», το οποίο έχει σχεδιαστεί από την Κεντρική Επιτροπή για την Κωδικοποίηση προτύπων και της νομοθεσίας στο Νόμο 2003/3133. Η κωδικοποίηση του νομικού εγγράφου οργανώνεται σε μια δεντρική ιεραρχία γύρω από την έννοια των "αποσπασμάτων" που είναι άρθρα, παράγραφοι, περιπτώσεις ή εδάφια. Αυτά τα αποσπάσματα περιγράφονται παρακάτω. Τα άρθρα είναι τα βασικά τμήματα του κειμένου του νομικού εγγράφου και αριθμούνται με αραβικούς αριθμούς (1, 2, 3, ...) ή στην περίπτωση της εισαγωγής ενός νέου άρθρου σε ένα υπάρχον νομικό έγγραφο, με το συνδυασμό του αραβικού αριθμού με κεφαλαία ελληνικά γράμματα (Α, Β, Γ, ...). Ένα άρθρο που μπορεί να έχει μια λίστα με τις παραγράφους που αριθμούνται με αραβικούς αριθμούς. Εάν ένα αντικείμενο έχει μια μόνο παράγραφο, η αρίθμηση της παραγράφου παραλείπεται. Οι παράγραφοι μπορούν να έχουν μια λίστα περιπτώσεων. Οι περιπτώσεις αριθμούνται με πεζά ελληνικά γράμματα (α, β, γ, ...) και μπορεί να έχουν υπο-περιπτώσεις οι οποίες είναι αριθμημένες με το διπλά πεζά ελληνικά γράμματα (αα, ββ, ...). Η λεκτική περίοδος μεταξύ δύο τελειών έχει ονομαστεί εδάφιο. Τα εδάφια είναι τα στοιχειώδη τμήματα των νομικών εγγράφων και γράφονται συνεχόμενα, δηλαδή, χωρίς οποιαδήποτε διακοπή μεταξύ τους. Τα εδάφια είναι τα δομικά στοιχεία των περιπτώσεων και των παραγράφων. Τέλος, τα νομικά έγγραφα μπορούν να υποδιαιρεθούν ανάλογα με το μέγεθος τους σε μεγαλύτερες μονάδες, όπως βιβλία, κεφάλαια, ή τμήματα, τα οποία είναι αριθμημένα με κεφαλαία ελληνικά γράμματα. Οι μεγαλύτερες μονάδες και αντικείμενα μπορεί να έχουν τίτλο, ο οποίος πρέπει να είναι γενικός και συνοπτικός, προκειμένου να φέρουν το περιεχόμενό τους, και χρησιμοποιείται στη συστηματική ταξινόμηση της ουσίας των νομικών εγγράφων. Εκτός από τα προαναφερθέντα δομικά στοιχεία, τα νομικά έγγραφα συνοδεύονται από πληροφορίες μεταδεδομένων. Αυτά περιλαμβάνουν τον τίτλο του νομικού εγγράφου, ο οποίος πρέπει να είναι αρκετά γενικός, αλλά περιεκτικό, έτσι ώστε να αντανακλά το περιεχόμενό του, το είδος (π.χ., του νόμου, προεδρικού διατάγματος), το έτος δημοσίευσης, και τον αριθμό (δηλαδή, ο αύξων αριθμός μετρώντας από την αρχή του έτους για κάθε τύπο). Αυτά τα τελευταία τέσσερα κομμάτια των μεταδεδομένων χρησιμεύουν επίσης ως ένα μοναδικό αναγνωριστικό του νομικού εγγράφου. Εξίσου σημαντικά είναι επίσης, το θέμα και ο αριθμός φύλλου της Εφημερίδας της Κυβερνήσεως στο οποίο το νομικό έγγραφο δημοσιεύεται.

Παραπομπές

Όταν είναι απαραίτητη η αναφορά σε άλλο νομοθετικό έγγραφο, αυτό θα πρέπει να γίνεται ομοιόμορφα σε όλο το κείμενο. Συγκεκριμένα, για τους σκοπούς της ακρίβειας και της διευκόλυνσης της ανάγνωσης, τα έγγραφα θα πρέπει να φέρουν τον αριθμό του νομικού εγγράφου και το έτος δημοσίευσης. Κατά την πρώτη εμφάνιση του νομικού εγγράφου, το θέμα και ο αριθμός του φύλλου της Εφημερίδας της Κυβερνήσεως, πρέπει να αναφέρεται σε παρένθεση. Θα πρέπει επίσης να αναφερθεί το απόσπασμα αυτού, όπου υπάρχει τέτοια παραπομπή.

Νομοθετικές Τροποποιήσεις

Είναι κοινή διεθνής πρακτική η τροποποίηση ενός νομικού εγγράφου με μεταγενέστερα νομικά έγγραφα. Δυστυχώς, δεδομένης της κωδικοποίησης των νομικών εγγράφων, δεν υπάρχει τυποποιημένη μεθοδολογία που ακολουθείται για την κωδικοποίηση αυτής της νομοθετικής έννοιας. Αυτό καθιστά την όλη διαδικασία της τροπολογίας μια πρόκληση από την πλευρά μας. Με τη συστηματική παρατήρηση, καταλήξαμε στο συμπέρασμα ότι υπάρχουν τρεις βασικοί τύποι νομοθετικών τροποποιήσεων: 1) η αντικατάσταση ενός συγκεκριμένου κομματιού από ένα άλλο σε ένα μεταγενέστερο νομικό έγγραφο, 2) την εισαγωγή ενός νέου κομματιού και 3) η διαγραφή ενός συγκεκριμένου κομματιού. Όλα αυτά τα είδη των τροποποιήσεων παράγουν νέες εκδόσεις του αρχικού νομικού εγγράφου. Σε οποιαδήποτε χρονική στιγμή, η κατάσταση του νομικού εγγράφου αντιστοιχεί στο αρχικό έγγραφο με την εφαρμογή όλων των μεταγενέστερων τροποποιήσεων που εφαρμόζονται σε αυτό, μέχρι ένα συγκεκριμένο χρονικό σημείο.


Ενιαία Αναγνωριστικά Πόρων (URIs)

Τα Ενιαία Αναγνωριστικά Πόρων (URIs) είναι σύντομες εκφράσεις που προσδιορίζουν τους πόρους στον Ιστό: έγγραφα, εικόνες, αρχεία με δυνατότητα λήψης, υπηρεσίες, ηλεκτρονικά γραμματοκιβώτια, και άλλους πόρους. Η ταυτοποίηση αυτή επιτρέπει την αλληλεπίδραση με παραστάσεις ενός διαδικτυακού πόρου μέσω ενός δικτύου, συνήθως τον Παγκόσμιο Ιστό, χρησιμοποιώντας ειδικά πρωτόκολλα. Εκτός από την αξιοποίηση των αιτήσεων HTTP κατάλληλα, η ονοματοδοσία των πόρων είναι αναμφισβήτητα η πλέον πολυσυζητημένη και πιο σημαντική έννοια για να κατανοήσουμε κατά τη δημιουργία μιας κατανοητής, εύκολα διαχειρίσιμου Web API. Όταν οι πόροι ονομάτοδοτούνται σωστά, ένα API είναι διαισθητικό και εύκολο στη χρήση. Αν η ίδια διαδικασία δε γίνει σωστά, το ίδιο API μπορεί να έχει άχαρη αίσθηση και είναι δύσκολο να χρησιμοποιηθεί και να κατανοηθεί. Ουσιαστικά, ένα RESTful API καταλήγει να είναι απλώς μια συλλογή των URIs. Στην πλατφόρμα μας, κάθε πόρος έχει τη δική του διεύθυνση ή υπάρχει ένα URI για κάθε ενδιαφέρον κομμάτι πληροφοριών που η πλατφόρμα μπορεί να προσφέρει και εκτίθεται ως πόρος. Με άλλα λόγια, η κύρια αρχή του RESTful για διευθυνσιοδότηση καλύπτεται από τα URIs. Έχουμε επιλέξει ότι κάθε πόρος σε μια σουίτα υπηρεσιών θα έχει τουλάχιστον ένα URI για τον προσδιορισμό του. Και αυτό είναι προς όφελός μας, όταν ένα URI έχει νόημα και περιγράφει επαρκώς τον πόρο. Τα URIs θα πρέπει να ακολουθούν μια προβλέψιμη, ιεραρχική δομή για την ενίσχυση της κατανόησης και, ως εκ τούτου, τη χρηστικότητά τους. Προβλέψιμη, με την έννοια ότι είναι συνεπής, ιεραρχική με την έννοια ότι τα δεδομένα περιγράφονται από δομικές σχέσεις

URIs και Ελληνική Νομοθεσία

Τα URIs για τμήματα της νομοθεσίας είναι πολύ σημαντικά, όσο είναι και για τα νομικά έγγραφα στο σύνολό τους. Διάφορες πρωτοβουλίες προσπαθούν να αναβαθμίσουν την αξιόπιστη κατηγοριοποίηση της νομοθεσίας για τα υπάρχοντα βιβλιογραφικά σύστημα. Στόχος τους είναι να διευκολύνουν τη διαδικασία της δημιουργίας URIs για νομικές πηγές, ανεξάρτητα από την ύπαρξη ενός εγγράφου στο διαδίκτυο, την τοποθεσία ενός εγγράφου, καθώς και τον τρόπο πρόσβασης σε αυτό. Με βάση τη διεθνή πρακτική και τις ιδιαιτερότητες της ελληνικής νομοθεσίας, προτείναμε ένα σχήμα από URIs, το οποίο είναι όμοιο με αυτό του Ηνωμένου Βασιλείου. Στην πλατφόρμα μας κάθε ενιαίο νομικό έγγραφο, υποτμήματα του, εκδόσεις του ή υπηρεσίες είναι οι πόροι, οι οποίοι πρέπει να διευθυνσιοποιηθούν από ένα ειδικό σύστημα URIs. Τα συστήματα των URIs πρέπει να είναι συνεκτικά και να κατασκευάζονται, έτσι ώστε ένα URI για κάθε είδος πόρου να είναι ιδιαίτερα προβλέψιμο. Υπάρχουν μια σειρά από διαφορετικούς τρόπους που θα μπορούσε κανείς να εκχωρήσει ένα δόκιμο αναγνωριστικό σε ένα νομοθετικό κείμενο. Έχουμε αποφασίσει να χρησιμοποιήσουμε HTTP URIs. Αυτά τα URIs έχουν σχεδιαστεί σύμφωνα με τις κατευθυντήριες γραμμές της αντίληψής μας για το θέμα αυτό, αλλά ελπίζουμε ότι το έργο μας θα αποτελέσει ένα νέο τρόπο περιγραφής της ελληνικής νομοθεσίας μέσω του διαδικτύου.

Βασική Μορφή

Θα θέλαμε να παρουσιάσουμε το σχήμα των URIs που μπορεί κανείς να έρθει σε επαφή κατά τη χρήση των REST υπηρεσιών μας.

Βασική Μορφή:

http://legislation.di.uoa.gr/eli/{τύποςνομοθεσίας}/{έτος}/{αναγνωριστικό}

Κάθε πεδίο μεταξύ των αγκύλων πρέπει να λάβει συγκεκριμένη τιμή. Ως τύπο της νομοθεσίας, εννοούμε όλα τα διαφορετικά είδη της ελληνικής νομοθεσίας, που χρησιμοποιούν την κωδικοποίηση που ακολουθείται (π.χ. con, law, pd κ.ά.). Έτος είναι στην πραγματικότητα το έτος έκδοσης (π.χ., 2012) και αναγνωριστικό είναι ο αριθμός (ID) του συγκεκριμένου νομικού εγγράφου. Έτσι, για παράδειγμα, αν θέλουμε να ανακτήσουμε τον νόμο 12 του 2014, το αντίστοιχο URI θα είναι:

http://legislation.di.uoa.gr/eli/legislation/law/2014/12


Ένας επιπλέον στόχος, και όραμα ταυτόχρονα, από το έργο αυτό έχει ως σκοπό να μπορεί να θεωρηθεί ως μια RESTful (Representational State Transfer) διαδικτυακή πλατφόρμα και να παρέχει θεμέλια συστατικά για άλλες και ίσως πιο εξειδικευμένες εφαρμογές. Έχουμε αναπτύξει και ελπίζουμε να συνεχίσουμε την ανάπτυξη υπηρεσιών που επιτρέπουν στους χρήστες του API μας να ανακτήσουν την ελληνική νομοθεσία σε πολλές μορφές (PDF, RDF, XML και JSON) από την πρόσβαση μέσω HTTP GET αιτημάτων με συγκεκριμένα URIs.

Μορφές Δεδομένων

Δηλώνουμε διαρκώς, ότι η Νομοθεσί@ είναι ένα RESTful API. Ένας από τους στόχους της είναι να εξυπηρετήσει μια σειρά από διαδικτυακές υπηρεσίες της ελληνικής νομοθεσίας και να ενθαρρύνει περαιτέρω και πιο εξειδικευμένα έργα. Θα περιγράψουμε μερικές από αυτές τις υπηρεσίες, έτσι ώστε να μπορούμε να υπογραμμίσουμε τα οφέλη από τη συνεργασία με ένα ενιαίο μοντέλο δεδομένων RDF μέσω του διακομιστή RDF4J, ελπίζοντας να εμπνεύσει άλλα σχέδια για να υιοθετηθεί αυτή η μέθοδος, διαμορφώνοντας ένα απλούστερο Σημασιολογικό Ιστό. Στο API μας μπορεί κανείς να ζητήσει οποιοδήποτε νομικό έγγραφο σε μορφή PDF, XML, RDF, HTML και τη μορφή JSON, καθώς και την αρχική έκδοσή του ή την τρέχουσα ή ακόμη και μια ειδική έκδοση που βασίζεται σε μια ημερομηνία. Από τεχνολογικής πλευράς το μοντέλο δεδομένων RDF συνέβαλε με έναν πολύ καθοριστικό τρόπο. Έχουμε εξαλείψει τις περιττές κλήσεις στη βάση δεδομένων και ταυτόχρονα με τις επισημάνσεις κειμένου που προσφέρονται από το RDF, καταφέραμε να διαχωρίσουμε το κείμενο ενός νομικού εγγράφου βάσει του αιτήματος. Με αυτόν τον τρόπο δεν κρατάμε μόνο την πολυπλοκότητα χαμηλά λόγω των περιορισμών επερωτήσεων (ένα μόνο επερώτημα για να φέρουμε όλα τα στοιχεία και στη συνέχεια αποφασίζουμε τι πρέπει να χρησιμοποιηθεί), αλλά επίσης έχουμε παρουσιάσει ένα επεκτάσιμο μοντέλο που μπορεί να υιοθετήσει πολύ εύκολα περισσότερες γλώσσες στο μέλλον.

SPARQL Endpoint

Η SPARQL μπορεί να χρησιμοποιηθεί για να εκφραστούν ερωτήματα σε διάφορες πηγές δεδομένων, εάν τα δεδομένα αποθηκεύονται τοπικά ως RDF ή τα βλέπουν ως RDF μέσω κάποιου middleware. Η SPARQL περιέχει δυνατότητες για την αναζήτηση υποχρεωτικών και προαιρετικών προτύπων γράφων μαζί με τις ανισότητες και τις συζεύξεις τους, ενώ επίσης υποστηρίζει επεκτατικά δοκιμαστικά και περιοριστικά ερωτήματα πάνω σε ένα γράφημα RDF. Για πρώτη φορά στην ελληνική νομοθεσία και σε όλο τον κόσμο, το έργο μας καινοτομεί με την ιδέα της διάθεσης ενός SPARQL Endpoint με τρόπο RESTful. Οι χρήστες μπορούν τώρα να επωφεληθούν των νομικών εγγράφων, όχι μόνο από την ανάγνωση τους, αλλά και ρωτώντας όλη τη σημασιολογική πληροφορία. Αυτό αποτελεί ένα νέο δρόμο στο μονοπάτι της νομοθεσίας που διανέμεται και συντάσσεται από οποιαδήποτε φορέα ή επίσημο όργανο και ελπίζουμε ότι πολλοί άλλοι θα ακολουθήσουν το δρόμο μας μέχρι να έχουμε ενωμένα κυβερνητικά αρχεία όλων των τύπων. Οι κύριες δραστηριότητες ερωτημάτων που υποστηρίζονται σε αυτό το σύστημα είναι οι εξής:

• Η απόκτηση νομοθετικού εγγράφου που ισχύει σε μια συγκεκριμένη ημερομηνία ή ένα χρονικό διάστημα

• Η ιστορική εξέλιξη του νομοθετικού εγγράφου..

• Αναζήτηση συγκεκριμένου κειμένου στο κείμενο του νομοθετικού εγγράφου.

• Οι νόμοι που καταργούνται με νόμο.

• Η απόκτηση όλων των ειδών των μεταδεδομένων (το μοντέλο επιτρέπει σε νέα μεταδεδομέν να περιληφθούν εύκολα).

• Περιγραφικά ερωτήματα σχετικά με το γράφημα RDF.

Μερικά συμπεράσματα είναι, ότι η αρχιτεκτονική μας είναι ανεξάρτητη των τύπων δεδομένων το οποίο αποτελεί το κλειδί στις REST Υπηρεσίες. Έχουμε μια ενοποιημένη αρχιτεκτονική με τη μορφή αιτήματος-απόκρισης, η οποία διαφοροποιείται από κάθε τύπο μόνο με την τελική μέθοδο που θα διαμορφώσει τον τύπο του πακέτου απόκρισης. Αυτό αποδεικνύει για άλλη μια φορά ότι τα μοντέλα δεδομένων RDF και η αρχιτεκτονική Spring MVC είναι τα πλέον κατάλληλα εργαλεία για ένα REST API όπως η Νομοθεσί@. Αποφύγαμε να δημιουργήσουμε μεγάλες και ακατάστατες μεθόδους για κάθε τύπο δεδομένων και καταλήξαμε σε μια επεκτάσιμη, εύκολη και έξυπνη ακολουθία κατασκευής των μεθόδων για την εξυπηρέτηση των αιτημάτων.


Ημερομηνίες Νομικών Εγγράφων

Στα νομικά έγγραφα εμφανίζονται οι ακόλουθες ημερομηνίες:

  • date_document - Ημερομηνία Υπογραφής

    Η ημερομηνία που το έγγραφο υπογράφηκε από την ελληνική κυβέρνηση. Η πληροφορία αυτής της ημερομηνίας εξάγεται απευθείας από το εκάστοτε ΦΕΚ μέσω των διαδικασιών επεξεργασίας και ανάλυσης κειμένου, και είναι προγενέστερη των υπολοίπων ημερομηνιών.

  • date_published - Ημερομηνία Δημοσίευσης

    Η ημερομηνία που το έγγραφο δημοσιεύθηκε στο ΦΕΚ. Και αυτή η ημερομηνία εξάγεται απευθείας από το κείμενο και συνήθως, έπεται κάποιων ημερών της ημερομηνίας υπογραφής. Ωστόσο, είναι πιθανόν και να ταυτίζονται.

  • date_into_force - Ημερομηνία Εφαρμογής

    Η ημερομηνία εφαρμογής των διατάξεων. Εξάγεται μέσω της ανάλυσης του κειμένου και σηματοδοτεί την έναρξη ισχύος των διατάξεων που προβλέπονται από τον εκάστοτε νόμο.

  • version_date - Ημερομηνία Έκδοσης

    Η ημερομηνία που ο νόμος και οι διατάξεις του ενημερώνονται από κάποιον άλλο νόμο. Η τροποποίηση ενός νομικού εγγράφου είναι μία κοινή διεθνής πρακτική και η ημερομηνία αυτή δηλώνει την ύπαρξη τροποποίησης στο παρόν έγγραφο.

  • today - Σήμερα

    Η ημερομηνία που δηλώνει την τρέχουσα και ενημερωμένη κατάσταση του νόμου. Η κατάσταση αυτή αντιστοιχεί στο αρχικό νομικό έγγραφο με την εφαρμογή όλων των μεταγενέστερων τροποποιήσεων που εφαρμόζονται σε αυτό, μέχρι και την σημερινή ημερομηνία.

TimelineImage

Νομοθεσί@: Υποδομή και Οντολογία

Τα βασικά υποσυστήματα της πλατφόρμας αποτελούνται από:

  • Nomothesia Ontology

    Η οντολογία της πλατφόρμας Νομοθεσί@ (Εικόνα 1) που υιοθετεί το πλαίσιο ELI (http://www.eli.fr/en/), το πρότυπο για την κωδικοποίηση της νομοθεσίας στα κράτη μέλη της Ε.Ε.

  • Nomothesia G3 Parser and Compiler

    Το υποσύστημα που επεξεργάζεται τα Α' τεύχη των Φύλλων Εφημερίδας της Ελληνικής Κυβέρνησης (ΦΕΚ) από το 1990 έως το 2018, παρέχοντας μια συλλογή με περισσότερες από 12.000 δομημένες νομοθετικές πράξεις.

  • Nomothesia Codification Parser

    Αυτό το υποσύστημα χρησιμοποιείται για να αναλύσει το νομικό κείμενο, να εξάγει νομοθετικές τροποποιήσεις και να παράσχει ενημερωμένη κωδικοποίηση της ελληνικής νομοθεσίας.

  • Nomothesia Named Entity Recognizer (NER) and Linker (NEL)

    Το υποσύστημα που αναγνωρίζει αναφορές σε πολλαπλές οντότητες όπως γεωπολιτικές οντότητες, πρόσωπα, γεωγραφικά σημεία αναφοράς και νομοθεσία και συνδέει τις αναφορές με ανοικτά δημόσια σύνολα δεδομένων (ελληνικές διοικητικές μονάδες και ελληνικούς πολιτικούς) προκειμένου να ενισχύσει τη βάση γνώσεων της Νομοθεσί@ και να αυξήσει τις δυνατότητες αναζήτησης των χρηστών.

  • Nomothesia EU Directive Linker

    Το υποσύστημα που αναγνωρίζει τις διασυνδέσεις μετάξυ των Ευρωπαικών Οδηγιών και των Αποφάσεων που τις ενσωματώνουν στην ελληνική νομοθεσία.

  • Nomothesia DataStore

    Η βάση δεδομένων που αποθηκεύει περισσότερα από 4,5 εκατομμύρια τριπλέτες που αποτελούν τη βάση γνώσης. Το Nomothesia Datastore αποτελεί τη "ραχοκοκαλιά" της πλατφόρμας.

  • Nomothesia RESTful API

    Το RESTful API που παρέχει REST υπηρεσίες τόσο σε ανθρώπους όσο και σε computer clients. Στο API μας μπορεί κανείς να ζητήσει οποιοδήποτε νομικό έγγραφο σε μορφή PDF, XML, RDF, HTML και τη μορφή JSON, καθώς και την αρχική έκδοσή του ή την τρέχουσα ή ακόμη και μια ειδική έκδοση που βασίζεται σε μια ημερομηνία.

  • Nomothesia SPARQL Endpoint

    Το Endpoint που παρέχει πρόσβαση για εκτέλεση επερωτήσεων σε SPARQL. Το έργο μας καινοτομεί με την ιδέα της διάθεσης ενός SPARQL Endpoint με τρόπο RESTful έτσι ώστε οι χρήστες να μπορούν να επωφεληθούν των νομικών εγγράφων, όχι μόνο από την ανάγνωση τους, αλλά και ρωτώντας όλη τη σημασιολογική πληροφορία.

  • Nomothesia Document-Topic Classifier

    Το συγκεκριμένο υποσύστημα θα κατηγοριοποιεί τους νόμους και τα άρθρα αυτών με βάση την ιεραρχία των θεματικών ενοτήτων που ορίζει ο Κώδικας Νομοθεσίας - Ραπτάρχης. (ΥΠΟ ΑΝΑΠΤΥΞΗ)

TimelineImage
Εικ.1 Οντολογία της Νομοθεσί@

TimelineImage
Εικ.2 Pipeline της Νομοθεσί@