Δείτε εδώ την ειδική έκδοση

Νέο μοντέλο AI της DeepSeek μειώνει το κόστος στο μισό

Το DeepSeek V3.2-Exp υπόσχεται μεγαλύτερη αποδοτικότητα και χαμηλότερο κόστος, φέρνοντας νέα δεδομένα στον ανταγωνισμό για τα μεγάλα γλωσσικά μοντέλα.

Νέο μοντέλο AI της DeepSeek μειώνει το κόστος στο μισό

Η κινεζική startup DeepSeek παρουσίασε το νέο της πειραματικό μοντέλο, το οποίο υπόσχεται να αυξήσει την αποδοτικότητα και να βελτιώσει την ικανότητα της τεχνητής νοημοσύνης να χειρίζεται μεγάλες ποσότητες πληροφοριών σε πολύ μικρότερο κόστος. Ωστόσο, παραμένουν τα ερωτήματα για το πόσο αποτελεσματική και ασφαλής είναι η αρχιτεκτονική.

Οπως θυμίζει το CNBC, η DeepSeek αναστάτωσε τη Silicon Valley όταν λάνσαρε ξαφνικά το πρώτο της μοντέλο R1 πέρυσι, δείχνοντας ότι είναι δυνατό να εκπαιδεύονται μεγάλα γλωσσικά μοντέλα (LLMs) γρήγορα, με λιγότερο ισχυρά chips και με λιγότερους πόρους.

Η εταιρεία κυκλοφόρησε τη Δευτέρα το DeepSeek-V3.2-Exp, μια πειραματική έκδοση του τρέχοντος μοντέλου της DeepSeek-V3.1-Terminus, η οποία ενισχύει περαιτέρω την αύξηση της αποδοτικότητας στα συστήματα AI, σύμφωνα με ανάρτηση στο φόρουμ Hugging Face.

«Το DeepSeek V3.2 συνεχίζει να εστιάζει στην αποδοτικότητα, τη μείωση κόστους και το open-source μοίρασμα», δήλωσε στο CNBC η Adina Yakefu, επικεφαλής της κινεζικής κοινότητας στο Hugging Face.

«Η μεγάλη βελτίωση είναι μια νέα λειτουργία που ονομάζεται DSA (DeepSeek Sparse Attention), η οποία κάνει την AI καλύτερη στη διαχείριση μεγάλων εγγράφων και συνομιλιών. Μειώνει επίσης το κόστος λειτουργίας της AI στο μισό σε σύγκριση με την προηγούμενη έκδοση».

ΣΧΟΛΙΑ ΧΡΗΣΤΩΝ

blog comments powered by Disqus
v
Απόρρητο