Jailbreak-Angriffe auf KI-Modelle hoch erfolgreich…

danny.frischknecht
19. Dezember 2024
Bildung, Gesellschaft, Medienbildung, News, Software, Technik

Forschende der EPFL erreichten mit Jailbreak-Angriffen auf Claude, GPT-4 und weitere Modelle eine Erfolgsquote von 100%.
Inside IT

Inside IT berichtet, wie Forschende der EPFL (ETH) Lausanne Angriffe auf KI-Modelle verübten und zu einer erschreckenden Erfolgsquote von 100% kamen.

„KI-Modelle sind trotz bestehender Schutzmassnahmen manipulierbar. Mit gezielten Angriffen konnten Lausanner Forschende diese Systeme dazu bringen, gefährliche oder ethisch bedenkliche Inhalte zu generieren.
Bei den getesteten KI-Modellen, darunter GPT-4 von OpenAI und Claude 3 von Anthropic, hatten die Forschenden der Eidgenössischen Technischen Hochschule in Lausanne (EPFL) mit sogenannten Jailbreak-Angriffen eine Erfolgsquote von 100%, wie aus einer Mitteilung der Hochschule hervorgeht.“

Hier geht es zum ganzen Beitrag:
https://www.inside-it.ch/ki-modelle-weisen-sicherheitsluecken-auf-20241219

ai epfl lausanne eth lausanne inside it it inside ki

M	D	M	D	F	S	S
						1
2	3	4	5	6	7	8
9	10	11	12	13	14	15
16	17	18	19	20	21	22
23	24	25	26	27	28	29
30	31