Εισαγωγή: ορισμός και Ιστορία της Βιοπληροφορικής. Υποδιαιρέσεις. Είδη των δεδομένων στη Βιοπληροφορική. Βάσεις δεδομένων: βάσεις δεδομένων βιβλιογραφίας, αλληλουχιών πρωτεϊνών και DNA, δομών, διπλωμάτων και οικογενειών, εξειδικευμένες βάσεις δεδομένων, εργαλεία ανάλυσης της πληροφορίας που είναι αποθηκευμένη στις βάσεις δεδομένων – Entrez, SRS. Στοίχιση ακολουθιών: Μέθοδοι εύρεσης ομοιοτήτων σε αλληλουχίες, ομολογία και ομοιότητα αλληλουχιών και η σημασία τους, αλγόριθμοι δυναμικού προγραμματισμού, ολική στοίχιση – Global Alignment – αλγόριθμος των Needleman και Wunch, τοπική στοίχιση – Local Alignment – αλγόριθμος των Smith και Waterman, υπολογισμός της στατιστικής σημαντικότητας της στοίχισης, πίνακες ομοιότητας και η σημασία τους, ποινές για τα κενά, ευριστικές μέθοδοι για αναζήτηση ομοιοτήτων σε βάσεις δεδομένων BLAST, FASTA. Πολλαπλή στοίχιση αλληλουχιών: Πολυδιάστατοι αλγόριθμοι δυναμικού προγραμματισμού, ευριστικές μέθοδοι πολλαπλής στοίχισης ακολουθιών – CLUSTAL, DIALIGN, T-Coffee, κλπ – φυλογενετικά δένδρα και πολλαπλές στοιχίσεις. Αλγόριθμοι πρόγνωσης στηριζόμενοι στην ακολουθία πρωτεϊνών και DNA: Πρόγνωση δευτεροταγούς δομής πρωτεϊνών και RNA, πρόγνωση διαμεμβρανικών τμημάτων πρωτεϊνών και προσανατολισμού τους, εύρεση πιθανών γονιδίων σε ακολουθίες DNA, Hidden Markov Models και Νευρωνικά Δίκτυα στη Βιοπληροφορική. Oι αλγόριθμοι forward και backward, αποκωδικοποίηση (αλγόριθμοι Viterbi, Nbest, Posterior, Posterior – Viterbi, OAPD), εκτίμηση παραμέτρων με τους αλγόριθμους Baum – Welch και Gradient Descent, ειδικές τροποποιήσεις του Hidden Markov Model για βιολογικά δεδομένα (Class HMM, αλγόριθμοι για σημασμένες ακολουθίες, αλγόριθμοι ενσωμάτωσης πειραματικής πληροφορίας, profile Hidden Markov Models)
Με την επιτυχή ολοκλήρωση του μαθήματος οι φοιτητές θα πρέπει να είναι ικανοί:
Γραπτές εξετάσεις