Czy po drugiej stronie ekranu naprawdę jest człowiek? Nowe badanie pokazuje, że sztuczna inteligencja potrafi już tak przekonująco prowadzić krótką rozmowę, że ludzie biorą ją za prawdziwego rozmówcę. Popularny model językowy zdał test Turinga z zaskakująco świetnym wynikiem. Naukowcy ostrzegają, że w sieci zaczyna się era „fałszywych ludzi”.
Czy potrafimy jeszcze rozpoznać, kiedy rozmawiamy z człowiekiem, a kiedy z maszyną? Nowe badanie opublikowane w czasopiśmie naukowym amerykańskiej Narodowej Akademii Nauk jednoznacznie wskazuje, że najnowsze modele językowe potrafią w krótkiej rozmowie wypaść tak przekonująco, że ludzie biorą je za prawdziwych rozmówców. Najlepszy wynik osiągnął GPT-4.5, który był uznawany za człowieka w aż 73 procentach przypadków.
Test Turinga został przedstawiony w 1950 roku przez słynnego brytyjskiego matematyka i informatyka Alana Turinga. W uproszczeniu miał sprawdzać, czy maszyna potrafi prowadzić rozmowę w taki sposób, aby człowiek nie był w stanie odróżnić jej od innego człowieka. Przez lata ten test był traktowany jako symboliczna granica między ludzką inteligencją a maszynową imitacją. Dziś ta granica zaczyna się zacierać. Właśnie dlatego wyniki nowego badania są tak istotne i jednocześnie niepokojące.
„Wyniki sugerują, że obecne systemy sztucznej inteligencji potrafią skutecznie naśladować ludzi w krótkich interakcjach, a jednocześnie rodzą pytania o to, na ile test Turinga pozostaje skuteczną miarą inteligencji” – napisali autorzy badania, Cameron Jones i Benjamin Bergen z Uniwersytetu Kalifornijskiego w San Diego.
W badaniu wzięły udział 284 osoby. Uczestnicy prowadzili pięciominutowe rozmowy tekstowe jednocześnie z człowiekiem i sztuczną inteligencją. Po zakończeniu wymiany musieli wskazać, który rozmówca był prawdziwą osobą. Wyniki okazały się przełomowe. GPT-4.5 był najczęściej uznawany za człowieka. Model Llama osiągnął wynik 56 procent, natomiast starsze systemy, takie jak GPT-4o i ELIZA, wypadały znacznie słabiej.
„Fakt, że modele radzą sobie tak dobrze, stawia przed nami nowe wyzwania w zrozumieniu tego, co właściwie mierzy test Turinga” – podkreślili badacze. Eksperci podkreślają, że jest to niezwykle ważny moment nie tylko dla rozwoju technologii, lecz także dla naszej codzienności. Jeżeli sztuczna inteligencja potrafi przekonująco udawać człowieka, kompletnie zmienia się sposób, w jaki powinniśmy myśleć o relacjach w sieci, bezpieczeństwie i zaufaniu do tego, co czytamy oraz do osób, z którymi rozmawiamy.
Autorzy badania ostrzegają przed zjawiskiem, które określają jako „counterfeit people”, czyli „fałszywi ludzie”. Chodzi o systemy sztucznej inteligencji, które mogą występować w sieci jako pozornie autentyczne osoby. Mogą komentować, doradzać, flirtować, sprzedawać, przekonywać albo wpływać na nasze decyzje. Ryzyko nie polega wyłącznie na tym, że ktoś pomyli AI z człowiekiem podczas krótkiej rozmowy. Znacznie poważniejsze jest to, że zaczniemy funkcjonować w przestrzeni, w której coraz trudniej będzie odróżnić prawdziwego człowieka od perfekcyjnie zaprojektowanej imitacji.
„Niezależnie od tego, czy zdanie testu Turinga oznacza, że duże modele językowe są podobne do ludzi albo inteligentne, przedstawione tu ustalenia mają bezpośrednie znaczenie społeczne i ekonomiczne” – ostrzegli Jones i Bergen. Badacze wskazują, że takie systemy mogą wpływać na rynek pracy, relacje społeczne, poczucie samotności i sposób, w jaki budujemy zaufanie online. Mogą też stać się narzędziem nacisku, zwłaszcza wtedy, gdy stoją za nimi firmy, organizacje lub osoby próbujące kształtować nasze opinie.
Paradoksalnie sukces sztucznej inteligencji podważa znaczenie samego testu. Jeżeli maszyna potrafi zdać go dzięki świetnej imitacji stylu rozmowy, nie oznacza to jeszcze, że myśli, czuje albo rozumie świat tak jak człowiek. Może to raczej oznaczać, że nauczyła się bardzo dobrze odtwarzać nasze językowe nawyki. Potrafi naśladować zawahania, żarty, emocjonalne skróty, drobne niedoskonałości i ton, który brzmi ludzko.
Wyniki badania nie oznaczają, że ludzie przestają być wyjątkowi. Pokazują jednak, że wchodzimy w etap, w którym zaufanie w sieci będzie wymagało nowych zasad. Możliwe, że będziemy potrzebować wyraźniejszego oznaczania treści generowanych przez AI, nowych standardów bezpieczeństwa i większej uważności w cyfrowych relacjach.
Autorzy badania nie tracą jednak nadziei. „Chociaż maszyna zdała teraz test Turinga po raz pierwszy, nie jest to ostatnia okazja, aby ludzie mogli w nim zwyciężyć” – podsumowali badacze.
Źródło: Cami Rosso, „AI Officially Passes the Turing Test, Landmark Study Shows”, psychologytoday.com [dostęp: 28.05.2026]