back to top

Εβαλαν την Τεχνητή Νοημοσύνη να διοικήσει μια εταιρεία: Αυτό που συνέβη λέει πολλά για το μέλλον της εργασίας

Τα όρια της Τεχνητής Νοημοσύνης (AI) στον χώρο της εργασίας αποκαλύπτει μία πρωτοποριακή μελέτη από ερευνητές του Πανεπιστημίου Carnegie Mellon που έχει έδρα στις ΗΠΑ.

Οι επιστήμονες προσομοίωσαν τη λειτουργία μιας επιχείρησης, στην οποία όλες οι βασικές θέσεις είχαν ανατεθεί σε προηγμένα μοντέλα Τεχνητής Νοημοσύνης, προκειμένου να αξιολογήσουν την ικανότητά τους να υποκαταστήσουν πραγματικούς εργαζομένους.

Τα αποτελέσματα αποδεικνύονται καθησυχαστικά για όσους ανησυχούν για την αντικατάσταση των θέσεων εργασίας από μηχανές.

Απογοητευτικές επιδόσεις από τους εργαζόμενους Τεχνητής Νοημοσύνης: Το 75% των εργασιών έμεινε ανεκπλήρωτο

Συγκεκριμένα, η εικονική επιχείρηση στελεχώθηκε από μοντέλα τεχνητής νοημοσύνης που βασίζονταν στα μοντέλα Claude (Anthropic), GPT-4o (OpenAI), Gemini (Google), Nova (Amazon), Llama (Meta) και Qwen (Alibaba). Οι «εικονικοί εργαζόμενοι» αυτοί ανέλαβαν διαφορετικά καθήκοντα -από χρηματοοικονομική ανάλυση και διαχείριση έργων έως ανάπτυξη λογισμικού-, ενώ συνεργάζονταν με άλλες εικονικές οντότητες, όπως ένα προσομοιωμένο τμήμα ανθρώπινου δυναμικού.

Τα μοντέλα αυτά Τεχνητής Νοημοσύνης κλήθηκαν να εκτελέσουν πλήθος σύνθετων καθηκόντων, όπως η ανάλυση δεδομένων από πολλαπλά αρχεία ή η επιλογή νέων επαγγελματικών χώρων μέσω εικονικών περιηγήσεων. Αν και το μοντέλο Claude 3.5 Sonnet παρουσίασε τις καλύτερες επιδόσεις, κατάφερε να ολοκληρώσει μόλις το 24% των εργασιών, με το ποσοστό να ανεβαίνει στο 34,4% αν ληφθούν υπόψη και οι μερικώς ολοκληρωμένες.

Το Gemini 2.0 Flash ακολούθησε με μόλις 11,4%, ενώ κανένα άλλο μοντέλο δεν ξεπέρασε το 10%. Πάντως, σε επίπεδο κόστους, το Claude 3.5 Sonnet ήταν σαφώς ακριβότερο (6,34 δολάρια ανά χρήση) σε σύγκριση με το Gemini 2.0 Flash (0,79 δολάρια).

Οι αποτυχίες των μοντέλων αυτών ΑΙ αποδίδονται κυρίως στην αδυναμία κατανόησης έμμεσων οδηγιών και κοινωνικού πλαισίου. Για παράδειγμα, όταν ζητούνταν να αποθηκεύσουν ένα αρχείο με κατάληξη «.docx», δεν αναγνώριζαν ότι πρόκειται για έγγραφο τύπου Microsoft Word. Επιπλέον, δυσκολεύονταν ιδιαίτερα στην πλοήγηση στο διαδίκτυο, ιδίως σε περιπτώσεις όπου εμφανίζονταν αναδυόμενα παράθυρα. Σε πολλές περιπτώσεις, μάλιστα, όταν «έχανε τον δρόμο του», ένα μοντέλο ΑΙ επέλεγε να παραλείψει τα δύσκολα μέρη της εργασίας και να δηλώσει την εργασία ως ολοκληρωμένη.

Η πλήρης αυτονομία της Τεχνητής Νοημοσύνης αργεί ακόμα

«Τα ευρήματα της μελέτης καταδεικνύουν ότι, παρότι η Τεχνητή Νοημοσύνη είναι ήδη εξαιρετικά αποτελεσματική σε εξειδικευμένες και σαφώς ορισμένες εργασίες, βρίσκεται ακόμη αρκετά μακριά από την πλήρη επιχειρησιακή αυτονομία.

Προς το παρόν, οι εργαζόμενοι μπορούν να νιώθουν ασφαλείς: η Τεχνητή Νοημοσύνη ίσως να είναι ισχυρός βοηθός, αλλά δεν είναι ακόμη έτοιμη να αναλάβει το “τιμόμι”», αναφέρει στο σχετικό άρθρο του το futura-science.com.

Πηγή: https://medispin.blogspot.com/2025/05/blog-post_5.html

Περισσότερα Άρθρα

Σχετικά Άρθρα

Νέες Δημοσιεύσεις

GLP-1: Tα φάρμακα για την παχυσαρκία μπορεί να βοηθούν με την φλεγμονή στις αρθρώσεις

Μια νέα προσέγγιση στην θεραπεία της αρθρίτιδας δίνουν τα αποτελέσματα μιας νέας μελέτης για τα φάρμακα κατά της παχυσαρκίας τύπου GLP-1. Ερευνητές ανακάλυψαν ότι η ορμόνη...

Η Ελλάδα πρώτη σε θανάτους από καρκίνο στην ΕΕ και δεύτερη στον ΟΟΣΑ

Τι δείχνει η ανάλυση του Οργανισμού Οικονομικής Συνεργασίας και Ανάπτυξης για τη θνητότητα από καρδιαγγειακά, νοσήματα αναπνευστικού και διαβήτη τύπου 2. Πολύ ψηλά σε θανάτους...

ECDC: Αυξάνεται η εξάπλωση πολυανθεκτικής Shigella στην Ευρώπη

Το Ευρωπαϊκό Κέντρο Πρόληψης και Ελέγχου Νοσημάτων (ECDC) προειδοποιεί για τη ραγδαία αύξηση πολυανθεκτικών και εκτεταμένα ανθεκτικών στελεχών Shigella σε πολλές ευρωπαϊκές χώρες. Η εξάπλωση αφορά κυρίως,...

Ετικέτες