Τετάρτη 2 Απριλίου 2014

Υπολογιστές που αλληλοεκπαιδεύονται


Μία μέθοδο η οποία επιτρέπει σε έναν υπολογιστή να δίνει συμβουλές και να «εκπαιδεύει» έναν άλλο υπολογιστή, με τρόπο που παραπέμπει σε «δάσκαλο» και «μαθητή» ανέπτυξαν ερευνητές του School of Electrical Engineering and Computer Science του Washington State University.

Το paper δημοσιεύθηκε online στο Connection Science, και επικεφαλής της έρευνας ήταν ο Μάθιου Ε. Τέιλορ, καθηγητής Τεχνητής Νοημοσύνης. Όπως έγινε γνωστό, οι ερευνητές έβαλαν τους «πράκτορές» τους (όπως χαρακτηρίζονται τα εικονικά ρομπότ που χρησιμοποιήθηκαν στο πλαίσιο της μελέτης), να λειτουργήσουν ως ζεύγη δασκάλων- μαθητών: στόχος ήταν η εκπαίδευση των «μαθητών» σε δύο ηλεκτρονικά παιχνίδια, το Pac-Man και μία έκδοση του Starcraft. Όπως έδειξε η έρευνα, ο «μαθητής» ήταν σε θέση να μάθει τα παιχνίδια, ξεπερνώντας μάλιστα τον δάσκαλο.

Το μυαλό πολλών φίλων της επιστημονικής φαντασίας θα πάει κατευθείαν σε απειλητικές ψηφιακές μορφές όπως ο «Skynet» του «Εξολοθρευτή» ή οι «Cylons» του «Battlestar Galactica», ωστόσο, σύμφωνα με τον Τέιλορ, τα ρομπότ δεν πρόκειται να κατακτήσουν τον κόσμο στο προσεχές μέλλον, καθώς «είναι πολύ χαζά». Όπως επισημαίνει ακόμα και τα πιο εξελιγμένα ρομπότ μπερδεύονται εύκολα – και όταν μπερδεύονται, σταματούν να λειτουργούν. Πολύ συχνά χρειάζεται δύο με τρεις φορές περισσότερος χρόνος από ό,τι πιστεύει ο ίδιος ότι απαιτείται για να κάνει ένα ρομπότ να λειτουργήσει, προσθέτει.

Η εκπαίδευση των υπολογιστών στα ηλεκτρονικά παιχνίδια αποτελεί σημαντικό τμήμα της έρευνας στη ρομποτική. Με αυτόν τον τρόπο, τα ρομπότ θα μπορούν να αλληλοεκπαιδεύονται σε νέες εργασίες, χωρίς να απαιτείται ανθρώπινη παρέμβαση: για παράδειγμα, ένα ρομπότ καθαρισμού θα μπορεί να εκπαιδεύσει τον αντικαταστάτη του.

Κατά τον Τέιλορ, ο καλύτερος τρόπος να εκπαιδευτεί σωστά ένα ρομπότ σε νέες δραστηριότητες είναι η μεταφορά του «εγκεφάλου» ενός «έμπειρου» προκατόχου του σε αυτό. Ωστόσο, εμφανίζονται προβλήματα όταν το hardware και το software δεν είναι συμβατά με το νέο μοντέλο.

Στο πλαίσιο της μελέτης, οι ερευνητές προγραμμάτισαν τους «δασκάλους» να επικεντρώνονται σε συμβουλές πάνω στη δράση – ειδικότερα, το πότε ο «δάσκαλος» λέει στον «μαθητή» ότι πρέπει να ενεργήσει. «Σχεδιάσαμε αλγορίθμους για παροχή συμβουλών, και προσπαθούμε να διαπιστώσουμε πότε οι συμβουλές μας έχουν τη μεγαλύτερη επίδραση» αναφέρει ο Τέιλορ.




ΠΗΓΗ

Δεν υπάρχουν σχόλια:

Δημοσίευση σχολίου