Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Biały Dom: Trump nie weźmie udziału w tegorocznej konferencji CPAC z ostatniej chwili
Biały Dom: Trump nie weźmie udziału w tegorocznej konferencji CPAC

Prezydent USA Donald Trump nie weźmie udziału w tegorocznej konferencji środowisk konserwatywnych CPAC w Teksasie – przekazał w środę Biały Dom. Oznacza to, że Trump nie spotka się w Dallas z prezydentem RP Karolem Nawrockim, który w sobotę wystąpi na konferencji.

Samuel Pereira: Ten proces, to Wasz proces, Koalicjo Obywatelska tylko u nas
Samuel Pereira: Ten proces, to Wasz proces, Koalicjo Obywatelska

Mężczyzna spotykał się z dziewczynkami pod pretekstem badań nad wadami postawy. Miał im kazać się rozbierać, dotykać je oraz fotografować. Twierdził, że zdjęcia są po prostu elementem dokumentacji medycznej. Śledczy zajęli się sprawą po tym, jak matka jednej z ofiar złożyła zawiadomienie. Szefa złotowskiej Platformy Obywatelskiej i działacza sportowego Piotra P. zatrzymano pod zarzutem pedofilii 1 grudnia 2023 roku.

Copa-Cogeca: Ustępstwa poczynione przez KE wobec Australii są nie do przyjęcia z ostatniej chwili
Copa-Cogeca: Ustępstwa poczynione przez KE wobec Australii są nie do przyjęcia

„Ogłoszenie zawarcia umowy o wolnym handlu między UE a Australią w Canberze przez przewodniczącą Komisji Europejskiej von der Leyen i premiera Australii Albanese budzi liczne i poważne obawy dotyczące europejskiego rolnictwa, które jest wyraźnie i po raz kolejny kartą przetargową strategii UE mającej na celu zabezpieczenie szerszych celów handlowych i politycznych” – stwierdzają Copa-Cogeca.

Uzależniła się od mediów internetowych. Meta i YouTube mają jej wypłacić 3 mln dol. z ostatniej chwili
Uzależniła się od mediów internetowych. Meta i YouTube mają jej wypłacić 3 mln dol.

Ława przysięgłych w sądzie w Los Angeles uznała, że Meta i YouTube są odpowiedzialne za szkody dla zdrowia psychicznego 20-letniej kobiety, która oskarżyła je o przyczynienie się do uzależnienia, kiedy była dzieckiem. Firmy mają wypłacić kobiecie 3 mln dol. odszkodowania.

Biały Dom: Trump rozpęta piekło, jeśli Iran nie zawrze porozumienia z ostatniej chwili
Biały Dom: Trump "rozpęta piekło", jeśli Iran nie zawrze porozumienia

– Jeśli Iran nie zawrze porozumienia i nie zrozumie, że został pokonany, prezydent Donald Trump gotowy jest rozpętać piekło – zapowiedziała rzeczniczka Białego Domu Karoline Leavitt. Potwierdziła, że doniesienia o 15-punktowej propozycji USA są tylko częściowo prawdziwe.

Warszawa przegrała konkurs na siedzibę Urzędu Celnego UE z ostatniej chwili
Warszawa przegrała konkurs na siedzibę Urzędu Celnego UE

W środę Parlament Europejski i Rada UE podjęły decyzję o utworzeniu przyszłego Urzędu Celnego UE w Lille we Francji. O lokalizację unijnej instytucji ubiegała się Warszawa.

Nawrocki odpowiedział Tuskowi zdjęciem. W sieci zawrzało z ostatniej chwili
Nawrocki odpowiedział Tuskowi zdjęciem. W sieci zawrzało

Węgry zapowiadają zakręcanie kurka z gazem dla Ukrainy. Donald Tusk postanowił powiązać tę decyzję z niedawną wizytą Karola Nawrockiego na Węgrzech. Polski prezydent odpowiedział mu zdjęciem.

Sławomir Nowak złożył zawiadomienie na prokuratora, który wcześniej stawiał mu zarzuty z ostatniej chwili
Sławomir Nowak złożył zawiadomienie na prokuratora, który wcześniej stawiał mu zarzuty

Jak poinformował TVN24, Sławomir Nowak złożył zawiadomienie o możliwości popełnienia serii przestępstw przez prokuratora Jana Drelewskiego, który prowadził śledztwa przeciwko niemu.

ZUS wydał pilny komunikat z ostatniej chwili
ZUS wydał pilny komunikat

ZUS zapowiada poradnik dla kobiet w ciąży i uruchamia specjalny adres mailowy dla przyszłych mam. Instytucja podkreśla też, że nadal prowadzi kontrole zgodnie z obowiązującymi przepisami.

ONZ: Konflikt USA i Izraela z Iranem wymyka się spod kontroli z ostatniej chwili
ONZ: Konflikt USA i Izraela z Iranem wymyka się spod kontroli

Sekretarz generalny ONZ Antonio Guterres oświadczył w środę, że konflikt na Bliskim Wschodzie wymyka się spod kontroli i może się rozwinąć w jeszcze większą wojnę. Wezwał też USA i Izrael do zakończenia tego konfliktu zbrojnego, a Iran - do zaprzestania ataków na inne kraje.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane