Μάθημα: Επεξεργασία Ομιλίας

Περιγραφή Μαθήματος

Οργάνωση Μαθήματος

Το μάθημα Επεξεργασία Ομιλίας είναι επιλογής της τρίτης κατεύθυνσης (Επικοινωνίες και Επεξεργασία Σήματος) και διδάσκεται το όγδοο (εαρινό) εξάμηνο, τρεις ώρες τη βδομάδα.
Το μάθημα περιλαμβάνει: α) τρεις ώρες θεωρίας σε κάθε διδακτική βδομάδα που διδάσκονται 9 εβδομάδες (σύνολο 27 ώρες) και β) τέσσερις τρίωρες σειρές ασκήσεων (8, 6, 1, και 2 ασκήσεων αντίστοιχα) με εξειδικευμένες εφαρμογές λογισμικού επεξεργασίας σημάτων ήχου και ομιλίας (το απαραίτητο λογισμικό δίδεται στους φοιτητές και επίσης είναι εγκατεστημένο στους σταθμούς εργασίας του Εργαστηρίου Επεξεργασίας Σήματος του Τμήματος) που πραγματοποιούνται σε 4 εβδομάδες (σύνολο 12 ώρες).
Όλη η οργάνωση του μαθήματος στηρίζεται στην πλατφόρμα e-class και απαιτείται εγγραφή του φοιτητή στο μάθημα στο e-class (το πολύ τη δεύτερη εβδομάδα διδασκαλίας - το μάθημα είναι «κλειστού τύπου» για την πλατφόρμα e-class) όπου περιλαμβάνονται οι διαφάνειες των παραδόσεων, οι σημειώσεις, οι εκφωνήσεις των ασκήσεων και γίνεται η παράδοση των ασκήσεων από τους φοιτητές.


Στόχοι

Ο στόχος του συγκεκριμένου μαθήματος συνίσταται στη θεωρητική και πρακτική εξοικείωση του φοιτητή με τις βασικές αρχές και μεθόδους ψηφιακής ανάλυσης, σύνθεσης/παραγωγής και αυτόματης αναγνώρισης ομιλίας, που χρησιμοποιούνται κατά την Επικοινωνία Ανθρώπου–Μηχανής με Ομιλία, τα Διαλογικά Συστήματα Αλληλεπίδρασης με Ομιλία, τους Φωνητικούς Browsers και τα Voice Portals, τα ενσωματωμένα συστήματα με φωνή και τα βοηθήματα Ατόμων με Αναπηρία.


Περιεχόμενο μαθήματος

Βασικά χαρακτηριστικά σημάτων ομιλίας. Μηχανισμοί και πρότυπα παραγωγής ομιλίας. Ακοή και αντίληψη ομιλίας. Μέθοδοι ψηφιακής ανάλυσης σημάτων ομιλίας. Η μέθοδος της γραμμικής πρόβλεψης. Ψηφιακή κωδικοποίηση ομιλίας. Μέθοδοι σύνθεσης ομιλίας. Μετατροπή κειμένου σε ομιλία. Μέθοδοι αναγνώρισης ομιλίας. Η ομιλία στην επικοινωνία ανθρώπου-μηχανής. Εφαρμογές στα συστήματα πληροφορικής και επικοινωνιών.


Βοηθήματα

  1. Γ. Κουρουπέτρογλου «Μαθήματα Επεξεργασίας Ομιλίας», Αθήνα 2005, Σημειώσεις (μοιράζονται δωρεάν και είναι διαθέσιμες και μέσω του το e-class)
  2. Lawrence R. Rabiner, Ronald W. Schafer «Introduction to Digital Speech Processing» Now Publishers Inc, 2007
  3. X. Huang, A. Acero, H.-W. Hon «Spoken Language Processing», Prentice-Hall, Englewood Cliffs, 2001

Ανθρώπινο Δυναμικό

Διδάσκων: Αναπληρωτής Καθηγητής: Γεώργιος Κουρουπέτρογλου
Βοήθεια στο Εργαστήριο: από υποψήφιο διδάκτορα της Ομάδας Επεξεργασίας Ομιλίας

Ώρες υποδοχής φοιτητών κατά τη διάρκεια των μαθημάτων: Τρίτη 15:00-17:00, Πέμπτη 12:00-14:00


Τρόποι αξιολόγησης / εξέτασης

Ο βαθμός του μαθήματος προκύπτει ως εξής: Για να μετρήσει ο βαθμός των ασκήσεων θα πρέπει ο φοιτητής να γράψει στις γραπτές εξετάσεις τουλάχιστον 3,5 (με άριστα το 7).

Πρώτη Ομάδα Εργαστηριακών Ασκήσεων

Δεύτερη Ομάδα Εργαστηριακών Ασκήσεων


Software Tools