Ένα βήμα πιο κοντά στη φυσική αλληλεπίδραση του ανθρώπου με τους υπολογιστές κάνει η OpenAI με το GPT-4o, το βελτιωμένο μοντέλο του ChatGPT, το οποίο παρουσίασε τη Δευτέρα (13/5), στην τελευταία προσπάθειά της να επεκτείνει τη χρήση του δημοφιλούς chatbot.
Η εταιρεία τεχνητής νοημοσύνης υποστηρίζει ότι το GPT-4o δεν είναι μόνο ταχύτερο από τις προηγούμενες εκδόσεις, αλλά επιπλέον το πιο προηγμένο γλωσσικό πρόγραμμα γενετικής νοημοσύνης που έχει αναπτυχθεί μέχρι σήμερα.
Μέχρι σήμερα, ο διάλογος με τα μοντέλα τεχνητής νοημοσύνης όπως το ChatGPT ήταν αργός και μάλλον αμήχανος, με κάθε απάντηση να έρχεται έπειτα από κάθε ερώτηση με κάποια καθυστέρηση. Ωστόσο, η OpenAI ανακοίνωσε ότι με το GPT-4o αυτό ανήκει πλέον στο παρελθόν, καθώς ο διάλογος γίνεται άμεσα και σχεδόν… ανθρώπινα.
Μάλιστα, το GPT-4ο μιλάει με ανθρώπινη φυσικότητα, μπορεί και αναγνωρίζει κείμενο και αντικείμενα και κάνει τα πρώτα βήματα αλληλεπίδρασης, καθώς όταν μιλάει μπορεί κανείς να το διακόπτει.
Σύμφωνα με το ertnews.gr, το GPT-4ο μπορεί να προετοιμάσει κάποιον για συνέντευξη και να κάνει διερμηνεία σε πραγματικό χρόνο. Ακόμη, μπορεί μέσω κάμερας να αντιληφθεί ποιόν ή τι έχει απέναντί του και να προσαρμοστεί αναλόγως, αλλά και να πει ανέκδοτα, ακόμη και να εκφραστεί με σαρκασμό.
Κατά τη διάρκεια της παρουσίασης του GPT-4o, η OpenAI έδειξε πώς μεταφράζει ζωντανά από τα αγγλικά στα ιταλικά και αντίστροφα, αλλά και πώς βοηθά στην επίλυση μιας γραμμικής εξίσωσης σε πραγματικό χρόνο σε χαρτί. Ακόμη, το GPT-4o παρείχε καθοδήγηση για καλύτερη αναπνοή, ακούγοντας μόνο πώς αναπνέει ο άνθρωπος.
Say hello to GPT-4o, our new flagship model which can reason across audio, vision, and text in real time: https://t.co/MYHZB79UqN
Text and image input rolling out today in API and ChatGPT with voice and video in the coming weeks. pic.twitter.com/uuthKZyzYx
— OpenAI (@OpenAI) May 13, 2024
Η OpenAI ανέφερε επίσης ότι το GPT-4o εκπαιδεύτηκε σε κείμενο, όραση και ήχο, πράγμα που σημαίνει ότι όλες οι είσοδοι και οι έξοδοι επεξεργάζονται από το ίδιο νευρωνικό δίκτυο. Αυτό είναι διαφορετικό από τα προηγούμενα μοντέλα της εταιρείας, GPT-3.5 και GPT-4, τα οποία επέτρεπαν στους χρήστες να κάνουν ερωτήσεις μιλώντας, αλλά στη συνέχεια να μεταγράψουν την ομιλία σε κείμενο.
Διαβάστε ακόμη
Morgan Stanley: Ποντάρετε στις ευρωπαϊκές μετοχές για το β’ εξάμηνο του έτους (πίνακες)
ΥΠΕΝ: Γιατί το υπουργείο θέλει νυχτερινό τιμολόγιο το μεσημέρι και πορτοκαλί τιμολόγια
Ο χαλκός χτυπάει ιστορικό ρεκόρ: Για πρώτη φορά πάνω από τα $11.000 – Ανησυχία για έλλειψη (γράφημα)
Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο ΘΕΜΑ