Λέγεται συχνά πως τα δεδομένα αποτελούν τον νέο «χρυσό», καθώς λειτουργούν ως τα βασικά καύσιμα για την ανάπτυξη συστημάτων Τεχνητής Νοημοσύνης. Για τον λόγο αυτό το μεταβαλλόμενο τοπίο γύρω από την δημιουργία μιας αγοράς γλωσσικών δεδομένων βρέθηκε στο επίκεντρο της Ημερίδα του Ευρωπαϊκού Χώρου Γλωσσικών Δεδομένων στην Ελλάδα, η οποία έλαβε χώρα στο Υπουργείο Ψηφιακής Διακυβέρνησης και Τεχνητής Νοημοσύνης.
Σημειώνεται ότι στόχος της ημερίδας ήταν η παρουσίαση του Χώρου Γλωσσικών Δεδομένων (Language Data Space - LDS), με τον οποίο η Ευρωπαϊκή Επιτροπή φιλοδοξεί να δημιουργήσει μια ευρωπαϊκή ψηφιακή αγορά πολυγλωσσικών και πολυτροπικών γλωσσικών δεδομένων που θα λειτουργεί με σεβασμό στις ευρωπαϊκές αξίες και σε πλήρη συμμόρφωση με τους κανόνες της ΕΕ.
Ποιο είναι το τοπίο της αγοράς
Κατά τη διάρκεια του πάνελ με θέμα «Πόσο έτοιμοι είμαστε για μια ελληνική αγορά γλωσσικών δεδομένων;», το οποίο συντόνισαν οι Μαρία Γιάγκου και Στέλιος Πιπερίδης (ΙΕΛ, ΕΚ Αθήνα), ο Άρης Μάρκου, Γενικός Διευθυντής του Συνδέσμου Επιχειρήσεων Καινοτόμων Εφαρμογών Ελλάδας ( ΣΕΚΕΕ) επισήμανε ότι στη Ελλάδα υπάρχουν εταιρείες που παράγουν Τεχνητή Νοημοσύνη, καθώς και εταιρείες που την ενσωματώνουν στις λύσεις που παράγουν. Ο ίδιος έφερε ως παράδειγμα ότι ο ΣΕΚΕΕ εκπροσωπεί πάνω από 80 μικρομεσαίες εταιρείες αυτή την στιγμή, οι οποίες όλες δραστηριοποιούνται στην τεχνολογία και παράγουν καινοτομία.
Σχετικά με τα δεδομένα, ο κ. Μάρκου τόνισε ότι βρισκόμαστε σε ένα αρχικό στάδιο, τουλάχιστον όσον αφορά τις μικρομεσαίες επιχειρήσεις, καθώς για τις μεγάλες παγκόσμιες εταιρείες το σενάριο είναι διαφορετικό. Σύμφωνα λοιπόν με τον ίδιο οι ΜμΕ παράγουν κυρίως οι ίδιες τα δεδομένα, δηλαδή συνήθως υπάρχει ένα project που θέλουν να τρέξουν και με βάση αυτό θέτουν έναν χρονικό ορίζοντα μέχρι αυτό να αρχίσει να παράγει αποτέλεσμα, έτσι ώστε να δημιουργηθούν δεδομένα με τα οποία θα εκπαιδευτεί, με σκοπό στη συνέχεια να προκύψει ένα προϊόν.
«Αυτό σημαίνει ότι σίγουρα υπάρχει ευκαιρία, καθώς εάν οποιαδήποτε εταιρεία ήξερε ότι θα μπορούσε να κερδίσει χρόνο έχοντας έτοιμα δεδομένα, προφανώς θα άλλαζε τελείως η εξίσωση», σχολίασε ο Γενικός Διευθυντής του ΣΕΚΕΕ.
Από την πλευρά της η Γενική Διευθύντρια της Εθνικής Βιβλιοθήκης, Χρύσα Νικολάου, μίλησε για έργα μαζικής ψηφιοποίησης στα οποία έχει προχωρήσει η Βιβλιοθήκη τα τελευταία χρόνια, ιδίως σε υλικό στο οποίο δεν υπάρχουν ανοιχτά πνευματικά δικαιώματα.
Οπότε σύμφωνα με την ίδια η Βιβλιοθήκη διαθέτει ένα πολύ μεγάλο και καλό υλικό ως πάροχος πια σε μεγάλα ελληνικά γλωσσικά μοντέλα, όμως υπάρχουν τρία βασικά ζητήματα που τους εμποδίζουν να προχωρήσουν.
Πρώτον η έλλειψη τεχνολογικών υποδομών. Δεύτερον, η εκπαίδευση του προσωπικού για την αξιοποίηση των γλωσσικών μοντέλων και των δεδομένων. Τρίτον, όπως υποστήριξε η κα Νικολάου χρειάζεται ένα θεσμικό πλαίσιο για να μπορέσουν να είναι σύννομοι όσον αφορά τα πνευματικά δικαιώματα, την προστασία των προσωπικών δεδομένων, τις αδειοδοτήσεις κ.λπ.
Σε ερώτηση για το εάν μπορούμε να κάνουμε Τεχνητή Νοημοσύνη μόνο με ανοιχτά δεδομένα, ο Αλέξανδρος Μελίδης, Γενικός Διευθυντής, ΕΕΛΛΑΚ – Οργανισμός Ανοιχτών Τεχνολογιών, απάντησε ότι: «Η σύντομη απάντηση είναι όχι, αλλά το σημαντικό και το στρατηγικό είναι να δούμε το πως θα απαντήσουμε σε αυτή την πρόκληση της έλλειψης ανοιχτών δεδομένων».
«Το πραγματικό ερώτημα είναι το εάν θα έχουμε την τεχνική επάρκεια να μπορέσουμε να προσαρμόσουμε, να αξιοποιήσουμε και να ελέγξουμε τα μοντέλα που ήδη υπάρχουν», συμπλήρωσε ο ίδιος.
Το δίλημμα για τα μίντια
Με τη σειρά του ο Διευθυντής της Media2day Εκδοτική, Γιώργος Παπανικολάου, ανέλυσε διεξοδικά των χώρο των δεδομένων από την οπτική των μίντια. Όπως επισήμανε: «Το μεγάλο πρόβλημα που αντιμετωπίζει γενικά ο χώρος των μίντια, ειδικά όταν δεν πρόκειται για διεθνείς κολοσσούς είναι ότι στο θέμα της Τεχνητής Νοημοσύνης μιλάμε για γλωσσικά δεδομένα, ενώ στην πραγματικότητα μιλάμε για γνωστικά δεδομένα».
«Δεν νομίζω ότι θα υπήρχε ο οποιοσδήποτε εκδότης ανά τον κόσμο που θα είχε αντίρρηση να προσφέρει κάποια στοιχεία, τα οποία θα εκπαίδευαν ένα γλωσσικό μοντέλο», τόνισε ο κ. Παπανικολάου, όμως εξήγησε πως έχουμε φύγει από αυτό το στάδιο, καθώς οι μεγάλοι ξένοι οργανισμοί Τεχνητής Νοημοσύνης, έχουν παρεξηγήσει το ελεύθερο προς χρήση που έχουν πολλά sites. Ο Διευθυντής της Media2day Εκδοτική ξεκαθάρισε πως το ελεύθερο αυτό σημαίνει ελεύθερο για προσωπική χρήση και όχι ελεύθερο για εμπορική χρήση.
Την ίδια ώρα, ο κ. Παπανικολάου έφερε στο προσκήνιο και το πολύ σοβαρό θέμα που αντιμετωπίζει ένα μέρος των μίντια που δεν έχει να κάνει με αυτή καθεαυτή την ειδησιογραφία, αλλά παράγει χρηστικές πληροφορίες, όπως λ.χ ποια είναι η καλύτερη εποχή για να επισκεφθεί κανείς τη Λιόν. Όπως σημείωσε το ChatGPT παράγει πλέον τέτοιες απαντήσεις, αλλά στην πραγματικότητα αυτές οι απαντήσεις αποτελούν συνονθύλευμα πληροφοριών από διάφορους ανθρώπους, οι οποίοι κάθισαν και έκαναν αυτή τη δουλειά.
Ο κ. Παπανικολάου τόνισε ότι ο τρόπος με τον οποίο εξελίσσεται πλέον η κατάσταση αποτελεί ένα δίκοπο μαχαίρι γιατί ήδη περάσαμε από μια πρώιμη φάση στην οποία καταλήξαμε να έχουμε το Google ως ένα τεράστιο μονοπωλιακό τροχονόμο στο ίντερνετ, καθώς το πόσο καλά μεταχειρίζεται το Google ένα site είναι πολλές φορές ζήτημα επιβίωσης για την μιντιακή πλατφόρμα.
Παράλληλα, ο ίδιος δεν έκρυψε πως ο εκδοτικός χώρος ανησυχεί ότι η Τεχνητή Νοημοσύνη θα ανεβάσει αυτή την πίεση προς τα μίντια, ενώ εάν οι συνθήκες συνεχίσουν να παραπέμπουν σε ξέφραγο αμπέλι θα προκύψει ένα δίλημμα, καθώς αρκετά μίντια θα κλείσουν λόγω της μεγάλης μείωσης στην επισκεψιμότητα τους. Προειδοποίησε δε πως σταδιακά δεν θα υπάρχουν σε αφθονία οι επικαιροποιημένες πληροφορίες, τις οποίες χρησιμοποιεί τώρα ελεύθερα κυρίως η αμερικανική Τεχνητή Νοημοσύνη.
Αναφερόμενος στο γενικό γεωπολιτικό πεδίο, ο Διευθυντής της Media2day Εκδοτική, εξήγησε πως αυτή την στιγμή υπάρχει ένας άνευ όρων αγώνας ανάμεσα στις υπερδυνάμεις για το ποιος θα έχει το προβάδισμα στην Τεχνητή Νοημοσύνη, καθώς θεωρείται το υπερόπλο του μέλλοντος, με έναν τρόπο ακόμα πιο ριζικό απ ότι ήταν στο παρελθόν τα πυρηνικά όπλα.
Ο κ. Παπανικολάου σημείωσε πως μιντιακοί οργανισμοί έχουν συνειδητοποιήσει εδώ και αρκετά χρόνια το πόση σημασία έχει το μέγεθος, διότι κανείς δεν θα τολμούσε να πει στη Google «έφτιαξες ένα google news όπου κάνεις τον τροχονόμο της σημασίας των ειδήσεων, χρησιμοποιώντας το δικό μας πρωτόλειο υλικό και δεν θέλουμε να μας σκρολάρεις».
«Δεν υπάρχει κάποιος που θα το κάνει αυτό γιατί απλούστατα το κόστος που θα είχε από τη μείωση της επισκεψιμότητας θα είναι μεγαλύτερο από το όφελος που θα είχε εάν έπαιρνε κάποια χρήματα», πρόσθεσε.
«Κατά την άποψη μας αυτό δεν θα έπρεπε να συμβεί και στον χώρο της Τεχνητής Νοημοσύνης και δεν υπάρχει πολύς χρόνος για να το αντιπαρέλθει κανείς αυτό», τόνισε.
Όσον αφορά την χρήση των δεδομένων των μίντια, ο Διευθυντής της Media2day Εκδοτική, εξήγησε πως για τους εκδότες, έχει μεγάλη σημασία ο ακριβής σκοπός αυτής της χρήσης, εάν δηλαδή καταλήγει να είναι άμεσα ανταγωνιστικός με τον ρόλο τον μίντια.
«Από εκεί και πέρα νομίζω ότι εάν οργανωθούν κάποιες κατάλληλες δομές στην Ελλάδα, αλλά και μέσα από την ιδιωτική πρωτοβουλία ορισμένες σαφώς ενδιαφέρουσες περιπτώσεις δεδομένων θα μπορούσαν να γίνουν και μέρος μίας αγοράς. Το τι συστατικά θα μπορούσε να έχει η τιμολόγηση είναι ένα πολύ σύνθετο θέμα στο οποίο δεν νομίζω ότι υπάρχει αυτή τη στιγμή κάποια πεπατημένη», κατέληξε ο ίδιος.
Τι προβλέπεται σε θεσμικό επίπεδο
Έπειτα, σχολιάζοντας την αρχιτεκτονική του παρόντος ευρωπαϊκού νομικού πλαισίου, ο Αλέξανδρος Νούσιας, Εκτελεστικός Διευθυντής, Δίκαιο και Ηθική ΤΝ, ΕΚΕΦΕ «Δημόκριτος» δήλωσε μεταξύ άλλων πως αυτή βασίζεται σε ένα παραδοσιακό πλαίσιο προστασίας της πνευματικής ιδιοκτησίας, το οποίο όμως είναι ανελαστικό του υφιστάμενου πλαισίου ως προς τις τρέχουσες ανάγκες.
«Η λύση που θεωρώ ότι θα καταλήξουμε αργά η γρήγορα είναι της θεσμικής εύλογης αμοιβής», τόνισε ο ίδιος.
Με τη σειρά του, ο Γιωργανδρέας Ζάννος, Διευθυντής του Οργανισμού Συλλογικής Διαχείρισης Έργων του Λόγου, υποστήριξε πως κατά τη γνώμη του η «καλύτερη και ασφαλέστερη λύση είναι η αδειοδότηση, δηλαδή οι συμβάσεις, διότι μέσω των συμβάσεων μπορούν προσδιοριστούν ακριβώς η χρήση και οι όροι της άδειας και αφετέρου μπορεί να επιτευχθεί μια ισορροπία για να καλυφθούν οι ανάγκες όσων χρειάζονται τα δεδομένα, αλλά παράλληλα να καλυφθούν οι ανάγκες αυτών που παράγουν τα δεδομένα».
Τέλος, αναφερόμενη συνολικά στον ευρωπαϊκό χώρος γλωσσικών δεδομένων η Φαίη Μακαντάση, Διευθύντρια Έρευνών στη διαΝΕΟσις, υπογράμμισε πως πρέπει και ευελπιστεί να είναι αυτός ο θεσμός που θα λειτουργεί ως θεματοφύλακας των θεμάτων γύρω από την Τεχνητή Νοημοσύνη και τα δεδομένα.