Εβαλαν την Τεχνητή Νοημοσύνη να διοικήσει μια εταιρεία: Αυτό που συνέβη λέει πολλά για το μέλλον της εργασίας

Τα όρια της Τεχνητής Νοημοσύνης (AI) στον χώρο της εργασίας αποκαλύπτει μία πρωτοποριακή μελέτη από ερευνητές του Πανεπιστημίου Carnegie Mellon που έχει έδρα στις ΗΠΑ.

Οι επιστήμονες προσομοίωσαν τη λειτουργία μιας επιχείρησης, στην οποία όλες οι βασικές θέσεις είχαν ανατεθεί σε προηγμένα μοντέλα Τεχνητής Νοημοσύνης, προκειμένου να αξιολογήσουν την ικανότητά τους να υποκαταστήσουν πραγματικούς εργαζομένους.

Τα αποτελέσματα αποδεικνύονται καθησυχαστικά για όσους ανησυχούν για την αντικατάσταση των θέσεων εργασίας από μηχανές.

Απογοητευτικές επιδόσεις από τους εργαζόμενους Τεχνητής Νοημοσύνης: Το 75% των εργασιών έμεινε ανεκπλήρωτο

Συγκεκριμένα, η εικονική επιχείρηση στελεχώθηκε από μοντέλα τεχνητής νοημοσύνης που βασίζονταν στα μοντέλα Claude (Anthropic), GPT-4o (OpenAI), Gemini (Google), Nova (Amazon), Llama (Meta) και Qwen (Alibaba). Οι «εικονικοί εργαζόμενοι» αυτοί ανέλαβαν διαφορετικά καθήκοντα -από χρηματοοικονομική ανάλυση και διαχείριση έργων έως ανάπτυξη λογισμικού-, ενώ συνεργάζονταν με άλλες εικονικές οντότητες, όπως ένα προσομοιωμένο τμήμα ανθρώπινου δυναμικού.

Τα μοντέλα αυτά Τεχνητής Νοημοσύνης κλήθηκαν να εκτελέσουν πλήθος σύνθετων καθηκόντων, όπως η ανάλυση δεδομένων από πολλαπλά αρχεία ή η επιλογή νέων επαγγελματικών χώρων μέσω εικονικών περιηγήσεων. Αν και το μοντέλο Claude 3.5 Sonnet παρουσίασε τις καλύτερες επιδόσεις, κατάφερε να ολοκληρώσει μόλις το 24% των εργασιών, με το ποσοστό να ανεβαίνει στο 34,4% αν ληφθούν υπόψη και οι μερικώς ολοκληρωμένες.

Το Gemini 2.0 Flash ακολούθησε με μόλις 11,4%, ενώ κανένα άλλο μοντέλο δεν ξεπέρασε το 10%. Πάντως, σε επίπεδο κόστους, το Claude 3.5 Sonnet ήταν σαφώς ακριβότερο (6,34 δολάρια ανά χρήση) σε σύγκριση με το Gemini 2.0 Flash (0,79 δολάρια).

Οι αποτυχίες των μοντέλων αυτών ΑΙ αποδίδονται κυρίως στην αδυναμία κατανόησης έμμεσων οδηγιών και κοινωνικού πλαισίου. Για παράδειγμα, όταν ζητούνταν να αποθηκεύσουν ένα αρχείο με κατάληξη «.docx», δεν αναγνώριζαν ότι πρόκειται για έγγραφο τύπου Microsoft Word. Επιπλέον, δυσκολεύονταν ιδιαίτερα στην πλοήγηση στο διαδίκτυο, ιδίως σε περιπτώσεις όπου εμφανίζονταν αναδυόμενα παράθυρα. Σε πολλές περιπτώσεις, μάλιστα, όταν «έχανε τον δρόμο του», ένα μοντέλο ΑΙ επέλεγε να παραλείψει τα δύσκολα μέρη της εργασίας και να δηλώσει την εργασία ως ολοκληρωμένη.

Η πλήρης αυτονομία της Τεχνητής Νοημοσύνης αργεί ακόμα

«Τα ευρήματα της μελέτης καταδεικνύουν ότι, παρότι η Τεχνητή Νοημοσύνη είναι ήδη εξαιρετικά αποτελεσματική σε εξειδικευμένες και σαφώς ορισμένες εργασίες, βρίσκεται ακόμη αρκετά μακριά από την πλήρη επιχειρησιακή αυτονομία.

Προς το παρόν, οι εργαζόμενοι μπορούν να νιώθουν ασφαλείς: η Τεχνητή Νοημοσύνη ίσως να είναι ισχυρός βοηθός, αλλά δεν είναι ακόμη έτοιμη να αναλάβει το “τιμόμι”», αναφέρει στο σχετικό άρθρο του το futura-science.com.

Πηγή: https://medispin.blogspot.com/2025/05/blog-post_5.html

Προηγούμενο άρθρο

Το εμβόλιο για τον έρπητα ζωστήρα μειώνει τον κίνδυνο καρδιαγγειακής νόσου

Επόμενο άρθρο

Πλέον τα ζευγάρια υγειονομικών θα συνυπηρετούν χωρίς χρονική προϋπόθεση

Εβαλαν την Τεχνητή Νοημοσύνη να διοικήσει μια εταιρεία: Αυτό που συνέβη λέει πολλά για το μέλλον της εργασίας

Περισσότερα Άρθρα

Σχετικά Άρθρα

Νέες Δημοσιεύσεις

Τι δείχνει η πρώτη ελληνική μελέτη για την συμβολή των εκστρατειών ενημέρωσης στην πρόληψη του καρκίνου

ΕΠΙΣΤΗΜΟΝΙΚΑ ΚΙ … ΑΛΛΑ”από τον Ομ. Καθηγητή, Ιωάννη , 21.7.2026 – ANTIYΠΕΡΤΑΣΙΚΑ στην ΕΓΚΥΜΟΣΥΝΗ και στην ΓΑΛΟΥΧΙΑ

Πέτρα στη χολή: Πότε χρειάζεται επέμβαση και ποιες είναι οι πιο ασφαλείς σύγχρονες τεχνικές

Ετικέτες

Τελευταία Νέα

Τι δείχνει η πρώτη ελληνική μελέτη για την συμβολή των εκστρατειών ενημέρωσης στην πρόληψη του καρκίνου

ΕΠΙΣΤΗΜΟΝΙΚΑ ΚΙ … ΑΛΛΑ”από τον Ομ. Καθηγητή, Ιωάννη , 21.7.2026 – ANTIYΠΕΡΤΑΣΙΚΑ στην ΕΓΚΥΜΟΣΥΝΗ και στην ΓΑΛΟΥΧΙΑ

Πέτρα στη χολή: Πότε χρειάζεται επέμβαση και ποιες είναι οι πιο ασφαλείς σύγχρονες τεχνικές

Δημοφιλή

Τι είναι η μεταβολική ηλικία: Πώς υπολογίζεται για τον καθένα και τι σημαίνει για την γενική υγεία

Επιλογές