Δευτέρα, 23 Δεκεμβρίου, 2024

Εφαρμογή ερευνητών της Google καταλαβαίνει καλύτερα από άνθρωπο σε ποιο μέρος της Γης τραβήχτηκε μια φωτογραφία

Ωραία είναι αυτή η φωτογραφία, αλλά που στο καλό τραβήχτηκε; Σε αυτό το συχνό ερώτημα, που οι άνθρωποι δυσκολεύονται να απαντήσουν, μια νέα εφαρμογή, την οποία δημιούργησαν τρεις ερευνητές της Google, τα καταφέρνει πολύ καλύτερα, «διαβάζοντας» πιο σωστά το τοπίο. Η εφαρμογή βρίσκεται ακόμη σε στάδιο ανάπτυξης και δεν έχει κυκλοφορήσει προς χρήση.
Οι ερευνητές, με επικεφαλής τον Τομπάιας Γουέιαντ, ανέπτυξαν ένα λογισμικό «βαθιάς μάθησης», το οποίο κάνει γεωεντοπισμό της φωτογραφίας, χρησιμοποιώντας μόνο πληροφορίες από τα εικονοστιχεία (πίξελ) της.
Εκ πρώτης όψεως φαντάζει δύσκολο έως αδύνατο να καταλάβει κανείς που τραβήχτηκε μια φωτογραφία, χωρίς να έχει άλλες πληροφορίες πέρα από την ίδια την εικόνα. Μερικές φορές οι άνθρωποι χρησιμοποιούν ενδείξεις, όπως ο καιρός, τα φυτά, διάφορα αντικείμενα κ.α. που φαίνονται στη φωτογραφία, για να βγάλουν συμπεράσματα – άλλες φορές με επιτυχία και άλλες όχι. Υπάρχουν και σχετικοί διαδικτυακοί τόποι όπως το GeoGuessr και το View from your Window, όπου οι χρήστες δοκιμάζουν τις ικανότητές τους.
Οι ερευνητές ακολούθησαν μια τελείως διαφορετική μέθοδο υπολογιστικής όρασης. Τοποθέτησαν ένα πλέγμα πάνω σε ένα ψηφιακό κόσμο, χωρίζοντας έτσι την επιφάνεια του πλανήτη σε χιλιάδες τετραγωνάκια διαφορετικών μεγεθών, ανάλογα με το πόσες φωτογραφίες τραβιούνται στην πραγματικότητα (π.χ. σε μια πόλη όπως η Νέα Υόρκη τραβιούνται πολύ περισσότερες φωτογραφίες από ό,τι σε μια έρημο, άρα το τετραγωνάκι της μεγαλούπολης είναι μεγαλύτερο).
Στη συνέχεια, τροφοδότησαν το λογισμικό τους με εκατομμύρια αποθηκευμένες φωτογραφίες, που συνοδεύονταν από πληροφορίες γεωεντοπισμού. Ακολούθως, το πρόγραμμα, που διαθέτει νευρωνική νοημοσύνη, δημιούργησε συσχετίσεις και αντιστοιχίες ανάμεσα στα πίξελ των εικόνων και στα τα μέρη όπου τραβήχτηκαν οι φωτογραφίες.
Τελικά, η εφαρμογή δοκιμάσθηκε με 2,3 εκατομμύρια φωτογραφίες από το Flickr. Όπως διαπιστώθηκε, κατάφερε να «πέσει μέσα» σε ποσοστό 48% όσον αφορά την ήπειρο που τραβήχτηκε μια φωτογραφία, 28,4% όσον αφορά τη συγκεκριμένη χώρα, 10,1% για την πόλη όπου έγινε η λήψη της φωτογραφίας και 3,6% για τον συγκεκριμένο δρόμο της πόλης.
Ίσως τα ποσοστά αυτά να μην φαίνονται εντυπωσιακά, αλλά ένας άνθρωπος δεν μπορεί να τα καταφέρει τόσο καλά, όταν βλέπει μια φωτογραφία που έχει τραβηχτεί κάπου στη Γη. Αυτό αποδείχθηκε, όταν οι τρεις ερευνητές αντιπαράθεσαν την εφαρμογή τους με τις επιδόσεις δέκα ανθρώπων σε ένα πείραμα.
Το επόμενο βήμα για τη βελτίωση της εφαρμογής θα είναι η ενσωμάτωση της ικανότητας να αναγνωρίζει αντικείμενα και άλλα γνωρίσματα (χρώμα δέρματος ανθρώπων, αρχιτεκτονική κτιρίων, είδος δέντρων, πινακίδες οδικής κυκλοφορίας κ.α.) και να τα συσχετίζει με συγκεκριμένες τοποθεσίες.
Σύνδεσμος: Για την προδημοσίευση της επιστημονικής εργασίας στη διεύθυνση: http://arxiv.org/abs/1602.05314


Ακολουθήστε τα Χανιώτικα Νέα στο Google News στο Facebook και στο Twitter.

Δημοφιλή άρθρα

Αφήστε ένα σχόλιο

Please enter your comment!
Please enter your name here

Εντός εκτός και επί τα αυτά

Μικρές αγγελίες

aggelies

Βήμα στον αναγνώστη

Στείλτε μας φωτό και video ή κάντε μία καταγγελία

Συμπληρώστε τη φόρμα

Ειδήσεις

Χρήσιμα