Eνημερωμένη έκδοση του μοντέλου τεχνητής νοημοσύνης Gemini παρουσίασε η Google, σ' ένα «τεράστιο άλμα» στην ικανότητα συλλογισμού και κωδικοποίησης, σύμφωνα με τα στελέχη της εταιρείας.
Το νέο μοντέλο Gemini 3 θα είναι άμεσα διαθέσιμο σε όλα τα κύρια προϊόντα της Google, συμπεριλαμβανομένης της αναζήτησης, και μπορεί να απαντά με διαδραστικά γραφικά. Το Gemini 3, όπως και ο προκάτοχός του, μπορεί να επεξεργάζεται κείμενο, εικόνες και άλλα μέσα, καθώς και να λύνει σύνθετα επιστημονικά και μαθηματικά προβλήματα, ανέφερε η εταιρεία. Έχει βελτιώσει θεαματικά την ικανότητά του να συλλογίζεται και να απαντά με βάση αυτά τα δεδομένα, δήλωσε σε ανακοίνωσή του την Τρίτη ο διευθύνων σύμβουλος Σούνταρ Πιτσάι.
Η Google ισχυρίζεται ότι το Gemini 3 θα φέρει «μια νέα εποχή νοημοσύνης», λέγοντας: «Είναι σύστημα αιχμής, σχεδιασμένο για να κατανοεί το βάθος και τις λεπτές αποχρώσεις — είτε πρόκειται για την αντίληψη ανεπαίσθητων ενδείξεων σε μια δημιουργική ιδέα είτε για την αποσαφήνιση επικαλύψεων σε δύσκολα προβλήματα».
Μέσα σε μόλις δύο χρόνια, «η τεχνητή νοημοσύνη έχει εξελιχθεί από απλή ανάγνωση κειμένου και εικόνων στην ανάγνωση του χώρου», δήλωσε ο Πιτσάι.
Η Google επιχειρεί να επαναβεβαιώσει την ηγετική της θέση στον ταχέως εξελισσόμενο αγώνα της παραγωγικής τεχνητής νοημοσύνης, όπου αντίπαλοι όπως η OpenAI και η Anthropic έχουν πρόσφατα κυκλοφορήσει σημαντικές αναβαθμίσεις των δικών τους μοντέλων.
«Αυτό είναι το πιο έξυπνο μοντέλο μας», δήλωσε ο Κοράι Καβουκτσούογλου, επικεφαλής τεχνολογίας της Google DeepMind. Θα βοηθήσει τους ανθρώπους «να ζωντανέψουν οποιαδήποτε ιδέα τους».
Το Gemini 3 μπορεί να μετατρέπει πληροφορίες μεταξύ διαφόρων φορμάτ και να δημιουργεί οπτικά στοιχεία ή εφαρμογές από μεμονωμένες υποδείξεις, ανέφεραν στελέχη της Google. Για παράδειγμα, όταν του ζητηθεί ένα ταξιδιωτικό σχέδιο, το Gemini 3 μπορεί να δημιουργήσει οπτικοποιήσεις, συμπεριλαμβανομένων διαδραστικών στοιχείων με δυνατότητα κλικ.
«Δεν πρόκειται μόνο για το πώς το Gemini 3 μπορεί να κατανοήσει την είσοδο δεδομένων. Μπορεί και να εξάγει δεδομένα με εντελώς νέους τρόπους», δήλωσε ο Τζος Γούντγουορντ, επικεφαλής της ομάδας Gemini της Google.
Το νέο μοντέλο θα χρησιμοποιηθεί για απαντήσεις στα πιο δύσκολα ερωτήματα στην Αναζήτηση Google ή στη Λειτουργία AI, ενώ οι πιο απλές ερωτήσεις θα βασίζονται σε άλλα μοντέλα Gemini.
Η Google παρουσίασε επίσης το Gemini 3 Deep Think, μια βελτιωμένη λειτουργία συλλογισμού που δοκιμάζει πολλαπλές υποθέσεις παράλληλα και επιλέγει την καλύτερη απάντηση. Η εταιρεία αναφέρει ότι μπορεί να χειριστεί προηγμένα προβλήματα πολλαπλών βημάτων, όπως κωδικοποίηση, επιστημονική έρευνα ή πολύπλοκο σχεδιασμό. Το Deep Think θα είναι διαθέσιμο πρώτα στους συνδρομητές του Google AI Ultra, του πιο ακριβοπληρωμένου προγράμματος της εταιρείας για την τεχνολογία τεχνητής νοημοσύνης.
Η εταιρεία, που έχει δαπανήσει δισεκατομμύρια για να προωθήσει τις εξελίξεις στην τεχνητή νοημοσύνη, ενσωματώνει την Gemini σε όλα τα κύρια προϊόντα της, συμπεριλαμβανομένου του προγράμματος περιήγησης Chrome.
Το τελευταίο τρίμηνο, οι πωλήσεις στη μονάδα Cloud, η οποία περιλαμβάνει την Gemini, αυξήθηκαν κατά 34% σε ετήσια βάση, στα 15,2 δισεκατομμύρια δολάρια, σε σύγκριση με εκτίμηση για 14,8 δισ. δολάρια. Η μονάδα θεωρείται ευρέως ως η ισχυρότερη πηγή ανάπτυξης της μητρικής Alphabet και η σαφέστερη ένδειξη για το πώς η άνθηση της τεχνητής νοημοσύνης συμβάλλει στις πωλήσεις της εταιρείας. Περίπου το 70% των πελατών του cloud χρησιμοποιούν την τεχνητή νοημοσύνη της Google, ανέφερε ο Πιτσάι.