Γλωσσική Τεχνολογία
Ιστοσελίδα του μαθήματος
Αντικείμενο και Σκοπός του μαθήματος
Το μάθημα της Γλωσσικής Τεχνολογίας ασχολείται με αλγορίθμους, μοντέλα και συστήματα αυτόματης επεξεργασίας και παραγωγής κειμένων φυσικής γλώσσας και ομιλίας. Πρόκειται για ιδιαίτερα σημαντικό γνωστικό τομέα, από τον οποίο αναμένεται να προκύψουν, μεταξύ άλλων, νέοι τρόποι αναζήτησης πληροφοριών, εξόρυξης γνώσεων και αλληλεπίδρασης με υπολογιστικά συστήματα. Η Γλωσσική Τεχνολογία είναι επίσης ιδιαίτερα σημαντική στα πληροφοριακά συστήματα οργανισμών, γιατί πολύ μεγάλο μέρος των γνώσεων ενός οργανισμού (π.χ. αλληλογραφία, πρακτικά συναντήσεων, εσωτερικές αναφορές, κανονισμοί, συμβόλαια, περιγραφές προϊόντων, εγχειρίδια, δημοσιεύσεις, διπλώματα ευρεσιτεχνίας) διατυπώνονται κυρίως σε φυσική γλώσσα. Επίσης, η επικοινωνία με τους πελάτες γίνεται σε μεγάλο βαθμό μέσω φυσικής γλώσσας (π.χ. ηλεκτρονικό ταχυδρομείο, τηλεφωνικά κέντρα, ιστοσελίδες παρουσίασης προϊόντων, ιστολόγια και κοινωνικά δίκτυα όπου οι πελάτες σχολιάζουν προϊόντα).
Ύλη του μαθήματος
- Μοντέλα n-γραμμάτων, εκτιμήσεις πιθανοτήτων, ορθογραφική διόρθωση.
- Κατηγοριοποίηση και παλινδρόμηση για κείμενα, λέξεις, ακολουθίες λέξεων.
- Συντακτική ανάλυση με πιθανοτικές και μη γραμματικές.
- Σημασιολογική ανάλυση και ανάλυση πραγματείας.
- Στατιστική μηχανική μετάφραση.
- Εξαγωγή πληροφοριών και εξόρυξη γνώμης από έγγραφα.
- Συστήματα ερωταποκρίσεων για συλλογές εγγράφων και οντολογίες.
- Παραγωγή περιλήψεων, παραγωγή κειμένων από οντολογίες.
- Αναγνώριση ομιλίας και συστήματα προφορικών διαλόγων.
Το μάθημα μπορούν να το επιλέξουν τόσο οι φοιτητές του ΠΜΣ «Πληροφοριακά Συστήματα» όσο και οι φοιτητές του ΠΜΣ «Επιστήμη των Υπολογιστών» (από το 2013-14 ανήκει και στα δύο προγράμματα σπουδών).
Εκπαιδευτικές δραστηριότητες και τρόποι αξιολόγησης/εξέτασης
Το μάθημα περιλαμβάνει μία τρίωρη διάλεξη και ένα εργαστήριο ή προσκεκλημένη εφαρμοσμένη παρουσίαση μίας ώρας την εβδομάδα. Σε κάθε ενότητα του μαθήματος παρέχονται (λυμένες ή/και άλυτες) ασκήσεις μελέτης (μερικές προγραμματιστικές), εκ των οποίων μία ή δύο ανά ενότητα παραδίδονται και βαθμολογούνται. Οι φοιτητές αξιολογούνται μέσω των παραδοτέων ασκήσεων μελέτης (50% του τελικού βαθμού) και των τελικών εξετάσεων (επίσης 50% του τελικού βαθμού).
Βιβλία και βοηθήματα
Το μάθημα βασίζεται στο βιβλίο Speech and Language Processing των D. Jurafsky και J.H. Martin, 2η έκδοση, Pearson, 2009, το οποίο υπάρχει στη βιβλιοθήκη του ΟΠΑ. Παρέχονται εκτενείς σημειώσεις σε μορφή διαφανειών. Το μάθημα συμπεριλαμβάνει πρόσθετη ύλη από ερευνητικά άρθρα, βιβλία, εικονοσκοπημένες διαλέξεις κορυφαίων ερευνητών του χώρου κλπ.
Προαπαιτούμενες γνώσεις
- Βασικές γνώσεις μαθηματικής ανάλυσης, διακριτών μαθηματικών, γραμμικής άλγεβρας και θεωρίας πιθανοτήτων.
- Για τις προγραμματιστικές ασκήσεις, απαιτείται ευχέρεια προγραμματισμού (π.χ. σε Java, C, C++, Python).
Άλλα προτεινόμενα μαθήματα
Προτείνεται στους φοιτητές που ενδιαφέρονται ιδιαίτερα για τη Γλωσσική Τεχνολογία να παρακολουθήσουν παράλληλα (χωρίς να απαιτείται) το μάθημα Μηχανική Μάθηση ή/και Ανάκτηση Πληροφοριών.
