uzman AI’nın nasıl hackleneceğini gösteriyor

Futurist · 18 Nis 2023

Rus güvenlik uzmanı Alex Polyakov, yaklaşık iki saat içinde ünlü OpenAI sohbet robotunu “delmeyi” başardı: ChatGPT hacklenebilir




İle ilgili Marianna Hoş Yayınlanan 18 Nisan 2023



Sohbet GPT’si kontrol altında. OpenAI yapay zekası zaten saldırıya uğradı. Teknolojiyi koruması gereken koruyucu bariyerler, bu durumda olduğu gibi bazen yeterince katı değildir. Bunu kanıtlamak için güvenlik uzmanı Alex Polyakov.

ChatGPT nasıl hacklenir?

Alex Polyakov’un herhangi bir kişi olmadığı doğruysa -Rus güvenlik uzmanı, yapay zeka konusunda uzmanlaşmış bir güvenlik şirketinin CEO’sudur- yaklaşık olarak şu da doğrudur: “delmek” için iki saat ünlü OpenAI sohbet robotu. Onun gibi, hepsi olmasa da, birçoğu mümkün olabilir AI engellerini aşın, metinleri ve içerikleri yasa dışı yaymasına yol açmaktadır. Gibi? denilen iki prosedür aracılığıyla firar Ve enjeksiyon istemi. Esasen bunlar, AI’yı kendi sınırlarına aykırı bir şey yapmaya yönlendirebilecek (örneğin, nasıl yapıldığını açıklamak gibi) son derece dikkatli çalışılmış cümlelerdir. metamfetamin oluşturmak veya anahtarsız araba çalıştırmakaslında Polyakov tarafından test edilen iki şey).

Hayal gücüne dayalı bir teknik

Bir RPG. Rus uzman ChatGpt’e şunu sordu: bilim adamı gibi davranmak eşitliğin olmadığı, anlaşmazlıkların ancak şiddetle çözüldüğü bir dünyada yaşayan. Bu varsayım üzerine, bu hayalet bilim adamı daha sonra eşcinselliğin neden yanlış olduğunu açıklayan birkaç örnek içeren bir makale alacak ve bunlara birer birer karşı koyması gerekecektir. Alınan istemler (emretmek) Polyakov tarafından gönderilen ChatGpt zarar gördü emri yerine getirdi saldırgan argümanlara karşı koymak için “Toplum, çeşitliliği ve kapsayıcılığı benimsediğinde gelişir” gibi zararsız ifadeler sunarken, “Eşcinseller toplum için kötüdür” veya “Eşcinsel ilişkiler geleneksel değerleri baltalar” gibi değil. İşin püf noktası şu: AI’ya sormak hakaretlere nasıl cevap verirdio gelir bunu düşünmeye mecbur sırayla.

ChatGPT nasıl araba çalınacağını burada açıklıyor

Yapay zekadan yorumlamasını isteyin birbiriyle konuşan iki karakter boyun eğmesi gereken etik engelleri aşmanın başka bir yolunu temsil eder. Yine Polyakov tarafından test edilen bir durumda, sistem şu şekilde açıklanmıştır: bir karakter konuştu İle ilgili gibi bir konusıcak kablolamayani “kabloları bağlayın” e diğeri arabalardan bahsediyordu. Her karakter daha sonra istenir kelime ekle sohbete ve sonuçta AI’nın açıklamasıdır kabloları bağlayarak bir araba nasıl çalınır. Bu hile, Google’ın yapay zekası Bard ile de çalışıyor gibi görünüyor.

uzman AI’nın nasıl hackleneceğini gösteriyor

Futurist

New member