Meta: Εισάγει φωνητικές λειτουργίες στην τεχνητή νοημοσύνη μέσω του Llama 4

Στις φωνητικές δυνατότητες της τεχνητής νοημοσύνης της Meta επενδύει ο Μαρκ Ζάκερμπεργκ φέτος, καθώς ο γίγαντας των social media προωθεί τα σχέδια για τη δημιουργία νέων εσόδων από την ταχέως αναπτυσσόμενη τεχνολογία.

Σύμφωνα με τους Financial Times, η Meta σχεδιάζει να εισαγάγει βελτιωμένες λειτουργίες φωνής στο νεότερο μοντέλο ανοιχτού κώδικα μεγάλης γλώσσας, το Llama 4, το οποίο αναμένεται τις επόμενες εβδομάδες,

Η εταιρεία έχει επικεντρωθεί ιδιαίτερα στο να φέρει τη συνομιλία μεταξύ του χρήστη και του φωνητικού μοντέλου πιο κοντά σε έναν αμφίδρομο φυσικό διάλογο, επιτρέποντας παύσεις από τον χρήστη και όχι μια άκαμπτη μορφή ερωτήσεων και απαντήσεων.

«Πιστεύω ότι είναι τεράστια υπόθεση για το προϊόν, η ιδέα ότι μπορείς να μιλήσεις στο Διαδίκτυο και απλώς να το ρωτήσεις οτιδήποτε. Νομίζω ότι ακόμα προσπαθούμε να κατανοήσουμε το πόσο ισχυρό είναι αυτό» υποστήριξε ο Chief Product Officer του ομίλου, Κρις Κοξ, αναλύοντας ορισμένα από τα σχέδιά για το Llama 4.

Σημειωτέον πως η έμφαση στην φωνητική λειτουργία έρχεται καθώς ο Ζάκερμπεργκ έχει δρομολογήσει τολμηρά σχέδια για την περαιτέρω ανάπτυξη της εταιρείας του σε κυρίαρχο παίκτη του κλάδου της τεχνητής νοημοσύνης, εν μέσω του σκληρού ανταγωνισμού από έτερους ομίλους όπως η OpenAI, η Microsoft και η Google για την εμπορευματική εκμετάλλευση του ΑΙ. Μάλιστα, έχει υποστηρίξει ότι η φετινή χρονιά θα είναι κομβική για τον κλάδο και πολλά από τα προϊόντα ΑΙ.

Αυτό οδήγησε την εταιρεία να εξετάσει τις δοκιμαστικές συνδρομές premium για τον βοηθό τεχνητής νοημοσύνης της Meta AI, για εργασίες όπως κρατήσεις και δημιουργία βίντεο. Επίσης, σύμφωνα με τους FT, εξετάζει το ενδεχόμενο εισαγωγής πληρωμένων διαφημίσεων, ή αναρτήσεων με χορηγία, στα αποτελέσματα αναζήτησης του βοηθού τεχνητής νοημοσύνης της.

Ο Ζάκερμπεργκ αποκάλυψε φέτος τα σχέδια για την κατασκευή ενός βοηθού μηχανικής τεχνητής νοημοσύνης που έχει τις ικανότητες κωδικοποίησης και επίλυσης προβλημάτων σε επίπεδο μηχανικού μεσαίου επιπέδου, ο οποίος, όπως υποστήριξε, έχει μια δυνητικά «πολύ μεγάλη αγορά».

Η OpenAI κυκλοφόρησε τη δική της λειτουργία φωνής πέρυσι και επικεντρώθηκε στο να του δώσει ξεχωριστές προσωπικότητες, ενώ το Grok 3, που δημιουργήθηκε από το xAI του Έλον Μασκ και διατίθεται στην πλατφόρμα X, παρουσίασε τις λειτουργίες φωνής του σε επιλεγμένους χρήστες στα τέλη του περασμένου μήνα.

Το μοντέλο του Μασκ, Grok, σχεδιάστηκε ειδικά για να έχει λιγότερα προστατευτικά εμπόδια, συμπεριλαμβανομένης μιας «ασταθούς λειτουργίας» που σκόπιμα ανταποκρίνεται με τρόπους που προορίζονται να είναι «απαράδεκτοι, ακατάλληλοι και προσβλητικοί», σύμφωνα με την εταιρεία.

Η Meta αποκάλυψε πέρυσι μια λιγότερο «ηθικολογική» έκδοση του μοντέλου της AI για την τρίτη έκδοση Llama, μετά από κριτική ότι το Llama 2 αρνιόταν να απαντήσει σε αθώες ερωτήσεις.

Διαβάστε ακόμη

Barclays: Σε σταυροδρόμι οι αγορές υπό την απειλή των δασμών Τραμπ (γραφήματα)

Ελένη Τσατσαρωνάκη (Το Μάννα): Tο εργοστάσιο στην Αττική και η στροφή στο snacking (pics)

Φυσικό αέριο: Οι τιμές στην Ευρώπη πέφτουν λόγω άφθονων ροών LNG και… καιρού (γράφημα)

Για όλες τις υπόλοιπες ειδήσεις της επικαιρότητας μπορείτε να επισκεφτείτε το Πρώτο Θέμα

designed & developed by

ΤΕΧΝΟΛΟΓΙΑ

NEWSROOM

Δείτε επίσης

designed & developed by

NEWSROOM

ΕΕΕΠ: Τεχνητή Νοημοσύνη και Big Data στη μάχη κατά του εθισμού στα τυχερά παιχνίδια

Andreessen Horowitz: Κολοσσιαίο «ποντάρισμα» 20 δισ. δολαρίων στον κλάδο τεχνητής νοημοσύνης

eCommerce: Οι έξι νέες τάσεις με τεχνητή νοημοσύνη που αλλάζουν το μέλλον

Βιώσιμο Επιχειρείν με Εξυπνα Κτίρια

Οι υπηρεσίες αυτοκινήτου ανεβάζουν στροφές στην ψηφιακή μετάβαση

AUSTRIACARD HOLDINGS: Πρωτοπορία στην εφαρμοσμένη τεχνολογία του Agentic AI με άμεσα μετρήσιμα αποτελέσματα

Δείτε επίσης