Ένα ακόμη μοντέλο τεχνητής νοημοσύνης ανακοίνωσε η OpenAI. Πρόκειται για το Sora, το οποίο δημιουργεί high-definition videos, διάρκειας 1 λεπτού, αξιοποιώντας κείμενο. Το Sora, ωστόσο, δεν θα είναι διαθέσιμο για το ευρύ κοινό άμεσα, αφού η εταιρεία το προορίζει για ένα μικρό γκρουπ ακαδημαϊκών και ερευνητών που θα αξιολογήσουν πρώτα τις συνέπειες της πιθανής κατάχρησής του.
Τι προσφέρει το Sora
“Το μοντέλο μπορεί να δημιουργήσει πολύπλοκες σκηνές με πολλούς χαρακτήρες, συγκεκριμένα είδη κινήσεων και ακριβείς λεπτομέρειες του θέματος και του φόντου,” ανέφερε η OpenAI. “Το μοντέλο κατανοεί όχι μόνο τι έχει ζητήσει ο χρήστης στο κείμενο ενεργοποίησης, αλλά και πώς αυτά τα πράγματα υπάρχουν στο φυσικό κόσμο.”
Ένα video που δημιουργήθηκε από το Sora δείχνει ένα ζευγάρι που περπατάει σε μια χιονισμένη πόλη του Τόκιο, ενώ πεταλούδες και χιονονιφάδες ανακινούνται γύρω τους.
Η OpenAI αναφέρει ότι το μοντέλο λειτουργεί ως αποτέλεσμα της “βαθιάς κατανόησης της γλώσσας”, η οποία του επιτρέπει να ερμηνεύει ακριβώς τα κείμενα ενεργοποίησης. Παρόλα αυτά, όπως συμβαίνει με τα AI image και video-generators που έχουμε δει, το Sora δεν είναι τέλειο.
Επίσης, το Sora δεν είναι το πρώτο text-to-video μοντέλο στην αγορά. Άλλες εταιρείες όπως η Meta, η Google και η Runway έχουν παρουσιάσει ανάλογα εργαλεία και κάποια τα έχουν καταστήσει ήδη διαθέσιμα στο κοινό. Παρ’ όλα αυτά, κανένα άλλο εργαλείο δεν είναι αυτή τη στιγμή σε θέση να δημιουργήσει video διάρκειας έως και 60 δευτερολέπτων. Επιπλέον, το Sora δημιουργεί ολόκληρα video με τη μία, αντί να τα συνθέτει καρέ-καρέ όπως άλλα μοντέλα.
Διαβάστε επίσης:
Κόβει τη… φόρα της υπερ-ευφυούς τεχνητής νοημοσύνης η OpenAI – Digital Life!