To δημοφιλές chatbot της OpenAI, ChatGPT, ήρθε η ώρα να αποκτήσει μερικά updates, προκειμένου να διαχειρίζεται φωνητικές εντολές και ερωτήματα που συνδέονται με εικόνες. Οι χρήστες πλέον θα μπορούν να έχουν μια φωνητική συνομιλία με το ChatGPT σε Android και iOS και να τροφοδοτούν εικόνες σε αυτό σε όλες τις πλατφόρμες. Οι νέες δυνατότητες θα είναι αρχικά διαθέσιμες στους χρήστες Plus και Enterprise. Όπως ενημερώνει όμως η εταιρεία, θα ακολουθήσουν και οι υπόλοιποι χρήστες.
Η OpenAI αναφέρει ότι οι φωνητικές συνομιλίες τροφοδοτούνται από ένα νέο text-to-speech μοντέλο που μπορεί να παράγει «ανθρώπινο ήχο από απλό κείμενο και λίγα δευτερόλεπτα δείγματος ομιλίας». Πέντε φωνές δημιουργήθηκαν με τη βοήθεια επαγγελματιών ηθοποιών. Πηγαίνοντας προς την αντίθετη κατεύθυνση, το σύστημα αναγνώρισης ομιλίας Whisper της εταιρείας μετατρέπει τις προφορικές λέξεις ενός χρήστη σε κείμενο.
ChatGPT can now see, hear, and speak. Rolling out over next two weeks, Plus users will be able to have voice conversations with ChatGPT (iOS & Android) and to include images in conversations (all platforms). https://t.co/uNZjgbR5Bm pic.twitter.com/paG0hMshXb
— OpenAI (@OpenAI) September 25, 2023
Οι λειτουργίες που βασίζονται στην εικόνα είναι επίσης ενδιαφέρουσες. Το OpenAI λέει ότι οι χρήστες μπορούν να σχεδιάσουν ένα γεύμα με βάση ένα στιγμιότυπο του τι υπάρχει στο ψυγείο τους ή να ζητήσουν από το ChatGPT να λύσει ένα μαθηματικό πρόβλημα που τραβάνε σε μια φωτογραφία.
Διαβάστε επίσης:
iPhone 15 Pro στο απόλυτο teardown video! Δείτε τον «εσωτερικό κόσμο» της νέας ναυαρχίδας της Apple!