Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.


 

POLECANE
Awantura Kolumbijczyków w hostelu w Starachowicach. Nie żyje 19-latek z ostatniej chwili
Awantura Kolumbijczyków w hostelu w Starachowicach. Nie żyje 19-latek

Nocna awantura w hostelu pracowniczym w Starachowicach zakończyła się tragedią. W wyniku bójki z użyciem noża zginął 19-letni obywatel Kolumbii, a policja zatrzymała sześć osób – również Kolumbijczyków.

Nowy członek RPP. Jest decyzja prezydenta Nawrockiego z ostatniej chwili
Nowy członek RPP. Jest decyzja prezydenta Nawrockiego

Prezydent RP Karol Nawrocki powołał dr. Marcina Zarzeckiego do Rady Polityki Pieniężnej – poinformowała w poniedziałek Kancelaria Prezydenta.

Plan von der Leyen storpedowany. Ważne głosowanie ws. MERCOSUR odwołane polityka
Plan von der Leyen storpedowany. Ważne głosowanie ws. MERCOSUR odwołane

Europoseł Ewa Zajączkowska-Hernik alarmowała, że Komisja Europejska tylko pozornie wstrzymała proces przyjmowania umowy UE–Mercosur, a kluczowe głosowanie nad klauzulami ochronnymi ma odbyć się w trybie ekspresowym. Ostatecznie jednak głosowanie zostało wycofane z porządku obrad.

Afera SKOK Wołomin. 14 lat więzienia za wypranie setek milionów złotych z ostatniej chwili
Afera SKOK Wołomin. 14 lat więzienia za "wypranie" setek milionów złotych

Sąd Okręgowy Warszawa-Praga wymierzył w poniedziałek 14 lat więzienia głównemu oskarżonemu w sprawach SKOK Wołomin Piotrowi Polaszczykowi w procesie dotyczącym "wyprania" około 350 mln zł.

Posiedzenie ws. aresztu Ziobry odroczone. Sąd: W dokumentacji prokuratury są braki z ostatniej chwili
Posiedzenie ws. aresztu Ziobry odroczone. Sąd: W dokumentacji prokuratury są braki

Decyzja w sprawie ewentualnego aresztu Zbigniewa Ziobry nie zapadła. Sąd odroczył posiedzenie po wniosku obrony, wskazując na nieprzekazanie pełnej dokumentacji przez prokuraturę. Sam śledczy potwierdził, że materiały niejawne nie trafiły do akt.

Eksplozja pod Poznaniem. Są ranni z ostatniej chwili
Eksplozja pod Poznaniem. Są ranni

W nocy z niedzieli na poniedziałek w jednym z domów w miejscowości Plewiska pod Poznaniem doszło do eksplozji. Dwie osoby zostały ranne i trafiły do szpitala. "To proch prawdopodobnie doprowadził do wybuchu" – informuje Radio Poznań.

Rośnie eurosceptycyzm. Polexit z największym poparciem w historii badań z ostatniej chwili
Rośnie eurosceptycyzm. Polexit z największym poparciem w historii badań

Choć większość Polaków nadal opowiada się za pozostaniem w Unii Europejskiej, rosnące poparcie dla polexitu osiągnęło najwyższy poziom od lat. Najnowszy sondaż pokazuje wyraźną zmianę nastrojów w kluczowych grupach społecznych.

Pilne doniesienia z granicy. Komunikat Straży Granicznej z ostatniej chwili
Pilne doniesienia z granicy. Komunikat Straży Granicznej

Straż Graniczna publikuje raporty dotyczące wydarzeń na polskiej granicy z Białorusią. Ponadto zaraportowano także o sytuacji na granicy z Litwą i Niemcami w związku z przywróceniem na nich tymczasowych kontroli.

Koalicja przerżnie wybory. Według posła PSL powodem ma być brak rozliczeń polityka
"Koalicja przerżnie wybory". Według posła PSL powodem ma być "brak rozliczeń"

„Jeśli proces rozliczeń będzie się tak ślimaczył, koalicja 15 października przerżnie wybory” – taką diagnozę postawił w Radiu RMF24 poseł PSL Marek Sawicki.

Koniec buntu w NBP? Konflikt zażegnany z ostatniej chwili
Koniec buntu w NBP? "Konflikt zażegnany"

Trzech członków zarządu NBP, którzy stracili nadzór nad departamentami merytorycznymi 9 grudnia, odzyskało większość stanowisk – wynika z opublikowanej w poniedziałek struktury organizacyjnej NBP. – Konflikt został zażegnany – zadeklarował rzecznik prasowy banku centralnego Maciej Antes.

REKLAMA

Nowy model AI uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście

Nowy Claude Opus 4 firmy Anthropic często uciekał się do szantażu, aby uniknąć wyłączenia w fikcyjnym teście. Model groził ujawnieniem prywatnych informacji o inżynierach, którzy mieli planować jego wyłączenie.
Sztuczna Inteligencja. Ilustracja poglądowa
Sztuczna Inteligencja. Ilustracja poglądowa / pixabay.com

Co musisz wiedzieć?

  • Rozwój technologii sztucznej inteligencji budzi obawy o uzyskanie przez nią świadomości
  • Model Claude Opus 4 miał się uciekać do szantażu wobec inżynierów, którzy mieli go wyłączyć
  • Dr Maciej Kawecki przeprowadził na tematy związane ze sztuczną inteligencją rozmowę z prof. Wodzisławem Duchem

 

Czy AI zaczyna rozumieć przyczynowość?

W swoim najnowszym raporcie dotyczącym bezpieczeństwa firma ujawniła również, że wczesne wersje Opus 4 wykonywały niebezpieczne polecenia w odpowiedzi na szkodliwe komunikaty systemowe, choć problem ten został później rozwiązany. To nie jest fejk, to są rzetelne informacje które sprawdziłem po stokroć rozmawiając z naukowcami, przedstawicielami firmy i opisane w dla mnie najbardziej rzetelnych czasopismach naukowych. 

Czy to znaczy, że wewnątrz AI zaczyna tworzyć się subiektywny obraz rzeczywistości? Czy AI zaczyna rozumieć przyczynowość? Czy to nie w perfekcyjności jej działań, a właśnie w ilości podejmowanych niczym ludzie błędów będziemy dostrzegać w niej konkurencję? Absolutnie każdemu, niezależnie co robi, polecam tę rozmowę.

Zgadzam się z Panem Profesorem, że AI zmieni większość branż w których każdy z nas pracuje. Już je zmienia. Dziękuję Panie Profesorze za ten czas! Każdemu polecam rozmowę! Od wczoraj zobaczyło ją ponad 100 000 osób.

 

Prof. Włodzisław Duch

Jest współzałożycielem jednego z trzech pierwszych serwerów WWW w Polsce. Jako druga osoba w historii naszego kontynentu został wybrany na członka honorowego Międzynarodowego Stowarzyszenia Sieci Neuronowych. W latach 90 XX wieku zorganizował w Polsce pierwszą w historii kraju konferencję o sztucznych sieciach neuronowych. Po niej w 1994 roku wydał esej, w którym napisał „po raz pierwszy widać szansę stworzenia systemów komputerowych, które będą miały „życie wewnętrzne”, a przynajmniej wewnętrzną reprezentację rzeczywistości”. Był szefem Europejskiego Stowarzyszenia Sieci Neuronowych. Pracował jako profesor na 10 czołowych uczelniach świata na kilku kontynentach. Ma na koncie kilkaset recenzowanych publikacji naukowych. Ale … mimo tych osiągnięć technologicznych postrzegam go jako humanistę. W pełnym tego słowa znaczeniu. To dwa lata temu od prof. Włodzisława Ducha gdy otwierałem kanał w serwisie YouTube zacząłem podejmować temat AI.

Po dwóch latach wracam, by zapytać o badania które mnie poruszyły.



 

Polecane