Πληροφορίες
Κωδικός Μαθήματος | EIP220 |
Εξάμηνο | 2ο |
Κατηγορία | Επιλογής |
Μονάδες ECTS | 7 |
Eclass Μαθήματος |
Διδάσκων
Σγάρμπας Κ.
Φακωτάκης Ν.
Προτεινόμενη Βιβλιογραφία
- Deller, J., J. Proakis, and J. Hansen. “Discrete-Time Processing of Speech Signals”. New York: Macmillan, 1993.
- Gersho, A. and R. M. Gray. “Vector Quantization and Signal Compression”. Boston: Kluwer, 1992.
- Jayant, N. S. and P. Noll. “Digital Coding of Waveforms: Principles and Applications to Speech and Video”. Signal Processing Series, ed.A. V. Oppenheim. Englewood Cliffs: Prentice-Hall, 1984.
- Kleijn, W. B. and K. K. Paliwal, ed. “Speech Coding and Synthesis”. Amsterdam: Elsevier, 1995.
- Lee, C.-H., F. K. Soong, and K. K. Paliwal, ed. “Automatic Speech & Speaker Recognition: Advanced Topics. International Series in Engineering & Computer Science, Natural Language Processing & Machine Translation: Multimedia Systems & Applications”. Boston:Kluwer Academic Publishers, 1996.
- Owens, F. J. “Signal Processing of Speech”. New York: McGraw-Hill, 1993.
- Rabiner, L. and B.-H. Juang. “Fundamentals of Speech Recognition. Signal Processing”, ed. A. Oppenheim. Englewood Cliffs: Prentice Hall, 1993.
Περιγαφή Μαθήματος
- Μοντελοποίηση ήχου. Κωδικοποίηση κυματομορφής PCM, ADPCM, Διαμόρφωση Δέλτα, VQ, βέλτιστη κβάντιση. Γραμμική πρόβλεψη. Αναλογικοί κωδικοποιητές φωνής. Ψηφιακοί κωδικοποιητές φωνής, (LPC, CELP).
- Ομομορφική επεξεργασία φωνής. Σύνθεση φωνής. Αναγνώριση φωνής, αναγνώριση ομιλητή. Μαρκοβιανά μοντέλα, Νευρωνικά δίκτυα .
- Υλικό ψηφιακής επεξεργασίας φωνής (digital signal processing (DSP) chips – TI, AT&T, Motorola and Motorola CVSD and ADPCM chips). Πρότυπα στάνταρ κωδικοποίησης φωνής. Μετασχηματισμός φωνής.