Είσοδος

Προχωρημένα Θέματα Επιστήμης και Αναλυτικής Δεδομένων

Γενικά στοιχεία

 

 
Περιγραφή

Τα τελευταία χρόνια παρατηρείται μία σημαντική αύξηση στις εφαρμογές των τεχνολογιών της μοντελοποίησης δεδομένων, της αναπαράστασης και διαχείρισης γνώσης και της μηχανικής μάθησης. Οι τεχνολογίες αυτές ενσωματώνουν τελευταία δυνατότητες για ανάλυση μεγάλου όγκου δεδομένων σε διάφορους τομείς όπως η ιατρική έρευνα, η διαχείριση πόρων, οι έξυπνες πόλεις κλπ.    

Το αντικείμενο του μαθήματος είναι η εισαγωγή στις βασικές έννοιες των παπαράπω τεχνολογιών. Συγκεκριμένα, μελετώνται οι βασικές μεθοδολογίες και τεχνικές, τα εργαλεία και περιβάλλοντα εργασίας που σχετίζονται με τη χρήση της μηχανικής μάθησης, των τεχνολογιών μοντελοποίησης δεδομένων και γνώσης, της αυτόματης συλλογιστικής και των σύγχρονων τεχνολογιών ανάπτυξης λογισμικού για την ανάλυση μεγάλου όγκου δεδομένων σε πραγματικές εφαρμογές. Επιπλέον, αναλύονται οι βασικές προκλήσεις των παραπάνω περιοχών της επιστημονικής έρευνας και μελετώνται πρακτικά συστήματα ανάπτυξης ευφυών συστημάτων ανάλυσης δεδομένων.

Στο μάθημα συνδυάζονται γνώσεις που παρουσιάζονται σε μία σειρά από μεταπτυχιακά μαθήματα της ΣΗΜΜΥ ΕΜΠ, μεταξύ άλλων στα 'Προχωρημένα Θέματα Βάσεων Δεδομένων', 'Νευρωνικά Δίκτυα και Μηχανική Μάθηση', 'Τεχνολογίες Σημασιολογικού Ιστού', 'Επικοινωνία Ανθρώπου Υπολογιστή'.

Οι διαλέξεις θα γίνονται στην Αίθουσα 1.1.29 στο παλιό Κτ. Ηλεκτρολόγων, κάθε Πέμπτη στις 10:45-13:30, σύμφωνα με τον προγραμματισμό που φαίνεται στην ενότητα Πρόγραμμα.

Οι διαλέξεις θα ξεκινήσουν την Πέμπτη 9 Μαρτίου 2017.

 

Ύλη

Η ύλη του μαθήματος καλύπτεται σε τρεις βασικές ενότητες. Η πρώτη αφορά στην εισαγωγή των απαραίτητων θεωρητικών θεμελίων που περιλαμβάνουν την αναπαράσταση γνώσης και συλλογιστική, αναζήτηση και ανάκτηση πληροφορίας, διαχείριση μεγάλου όγκου δεδομένων, αναλυτική δεδομένων, μηχανική μάθηση και σχεδιασμό λογισμικού. Η δεύτερη ενότητα επικεντρώνεται στην παρουσίαση σύγχρονων ευφυών συστημάτων αναλυτικής δεδομένων. Συγκεκριμένα, παρουσιάζεται στο πλαίσιο του μαθήματος το σύστημα Watson ως ένα σύστημα που ενσωματώνει τις περισσότερες από τις παραπάνω τεχνολογίες. Με τον τρόπο αυτό συνδέονται οι θεωρητικές γνώσεις με την πρακτική εφαρμογή τους, στις σύχρονες,  πραγματικές απαιτήσεις. Στην τρίτη ενότητα, οι φοιτητές εξασκούνται στο πλαίσιο των συστημάτων αυτών, αναπτύσσοντας σε ομάδες ολοκληρωμένες εφαρμογές αναλυτικής δεδομένων, με την υποστήριξη ερευνητών στην περιοχή. Οι εφαρμογές αυτές, παρουσιάζονται κατά τη διάρκεια του μαθήματος και αφορούν σύγχρονες περιοχές εφαρμογών των συγκεκριμένων τεχνολογιών.
 
Οι βασικές περιοχές που παρουσιάζονται στο πλαίσιο του μαθήματος είναι οι ακόλουθες:
 
Μηχανική Γνώσης
Βασικές αρχές και φορμαλισμοί εννοιολογικής μοντελοποίησης, αναπαράστασης γνώσης και σημασιολογικής αναπαράστασης δεδομένων.
 
Αυτόματη συλλογιστική και Μηχανική Μάθηση
Μεθοδολογίες και τεχνικές αυτόματης συλλογιστικής σε μεγάλους όγκους δεδομένων, μηχανικής μάθησης και αυτόματης μοντελοποίησης δεδομένων.
 
Αναπαράσταση, διαχείριση και ανάκτηση μεγάλου όγκου δεδομένων
Τεχνολογίες ανάκτησης δεδομένων, συστήματα αναζήτησης πληροφορίας, πιθανοτικά μοντέλα, απάντηση ερωτήσεων.
 
Μεγάλα Δεδομένα και Τεχνολογία Λογισμικού
Μεθοδολογίες διαχείρισης, αποθήκευσης και ανάκτησης μεγάλων δεδομένων, τεχνολογίες λογισμικού και ανάπτυξη υπηρεσιών για αναλυτική μεγάλων δεδομένων.

 

Βιβλιογραφία

Knowledge Representation and Reasoning, Ronald Brachman, Hector Levesque, Elsevier, 2004.

The Description Logic Handbook: Theory, Implementation and Applications, Edited by F. Baader, D. Calvanese, D. McGuiness, D. Nardi, P. Patel-Schneider, Second Edition, Cambrige University Press, 2007.

Foundations of Logic Programming, J.W. Lloyd, Springer-Verlag, 1984.

A Semantic Web Primer, G. Antoniou and F. van Hermelen, The MIT Press, Second Edition 2008.

Foundations of Semantic Web Technologies, Pascal Hitzler,  Markus Krötzsch,  Sebastian Rudolph, Chapman & Hall/CRC, 2009.

Αναπαράσταση οντολογικής γνώσης και συλλογιστική, Γ. Στάμου, διαθέσιμο στο Αποθετήριο «Κάλλιπος» [http://repository.kallipos.gr/handle/11419/4225].

Linked Data: Evolving the Web into a Global Data Space, Tom Heath, Christian Bizer, 2010.

Soft Computing and Intelligent Systems Design Theory, Tools and Applications, F.O. Karray, C. De Silva, Pearson Education (Addison-Wesley), 2004.

Neural Networks, A Comprehensive Foundation, S. Haykin, Prentice-Hall, 1999.

Artificial Intelligence, A Guide to Intelligent Systems, M. Negnevitsky, Pearson Education (Addison-Wesley), 2002.

Machine Learning, T. Mitchell, McGraw-Hill, 1997.

 

Εργασίες

Οι εργασίες θα γίνουν σε τρεις ομάδες φοιτητών που θα συνεργαστούν για την ανάλυση των απαιτήσεων, την ανάπτυξη των μοντέλων δεδομένων και την εκμάθηση του συστήματος μηχανικής μάθησης, σε μία συγκεκριμένη εφαρμογή.
 
Για τη φετινή χρονιά, οι φοιτητές θα επιλέξουν θέματα από αυτή τη φόρμα.

Mέθοδοι αξιολόγησης

Η τελική βαθμολογία υπολογίζεται από την παρουσίαση και από την εργασία που παραδίδεται στο τέλος του εξαμήνου.

 

Διδάσκοντες

Γιώργος Στάμου, Επ.Καθηγητής ΣΗΜΜΥ ΕΜΠ

Α.-Γ. Σταφυλοπάτης, Καθηγητής ΣΗΜΜΥ ΕΜΠ

Γ. Σιόλας, ΕΔΙΠ ΣΗΜΜΥ ΕΜΠ

Γιάννης Βασιλείου, Ομ. Καθηγητής ΣΗΜΜΥ ΕΜΠ

 

Βοηθοί

Γιώργος Αλεξανδρίδης, Διδάκτωρ ΗΜΜΥ 

Κώστας Τζαμαλούκας, ΕΔΙΠ ΣΗΜΜΥ ΕΜΠ

Αλέξανδρος Χορταράς, Πανεπιστημιακός Υπότροφος ΣΗΜΜΥ ΕΜΠ

 



Συγχρηματοδότηση
από την Ε.Ε.