Η Apple μπήκε επιτέλους στο “χορό” της τεχνητής νοημοσύνης, καθώς ο τεχνολογικός γίγαντας με έδρα το Cupertino παρουσίασε τα νέα γλωσσικά μοντέλα ανοιχτού κώδικα (LLMs) OpenELM (Open-source Efficient Language Models), τα οποία είναι σχεδιασμένα να “τρέχουν” απευθείας σε συσκευές και όχι μέσω υπηρεσιών cloud. Τα μοντέλα OpenELM είναι προς το παρόν διαθέσιμα στο Hugging Face Hub, τη γνωστή πλατφόρμα κοινής χρήσης κώδικα AI.
Σύμφωνα με τις τελευταίες πληροφορίες, το LLM της Apple είναι μια σουίτα οκτώ μικρών γλωσσικών μοντέλων, που αποτελείται από τέσσερα προ-εκπαιδευμένα με χρήση της βιβλιοθήκης CoreNet και τέσσερα μοντέλα συντονισμένα με οδηγίες. Η εταιρεία χρησιμοποιεί μια στρατηγική κλιμάκωσης, με στόχο τη βελτιστοποίηση τόσο της ακρίβειας όσο και της αποτελεσματικότητας.
Για να ξεχωρίσει το LLM από τους ανταγωνιστές, η Apple κυκλοφόρησε ολόκληρο το πλαίσιο, συμπεριλαμβανομένου του κώδικα, των αρχείων καταγραφής εκπαίδευσης και των πολλαπλών εκδόσεων. Η απόφαση της Apple να κάνει τα μοντέλα OpenELM ανοιχτού κώδικα στοχεύει στην ενδυνάμωση και τον εμπλουτισμό της ερευνητικής κοινότητας με υπερσύγχρονα γλωσσικά μοντέλα. Σύμφωνα με την Apple, με την κοινή χρήση μοντέλων ανοιχτού κώδικα, επιτρέπει στους ερευνητές όχι μόνο να χρησιμοποιούν τα μοντέλα αλλά και να εμβαθύνουν στις εσωτερικές λειτουργίες τους, επιτρέποντας ταχύτερη πρόοδο και «πιο αξιόπιστα αποτελέσματα» στον τομέα της τεχνητής νοημοσύνης.