SON GELİŞME

PUTİN’DEN ENERJİ SEKTÖRÜ AÇIKLAMALARI

İRAN DEVRİM MUHAFIZLARI ORDUSU’NDAN SERT AÇIKLAMA

İSRAİL HAVALANDIRMA SİSTEMLERİ İRAN FÜZELERİNİ ÖNLEDİ

Bahreyn İçişleri Bakanlığı: İran’ın Saldırısında 1 Kişi Hayatını Kaybetti

ABD Başkanı Trump, İran’ın Nükleer ve Balistik Füze Kapasitesini Değerlendirdi

Ülkenin Orta Kesimlerindeki Fırtına ve Kasırgalar Ağır Hasara Yol Açtı

PENTAGON’DAN AÇIKLAMA: NEW YORK’TA İKAMET EDEN ASKER KUVEYT’TE YAŞAMINI YİTİRDİ

BAPCO, İran Saldırılarının Etkileri Nedeniyle Mücbir Sebep İlan Etti

İSRAİL’İN GAZZE SALDIRILARINDA ÖLÜ SAYISI YÜKSELDİ

Trump: ABD ve İsrail’in İran’a Yönelik Saldırıları ve Benzin Fiyatları Hakkında Açıklama

Huawei, Dijital Dönüşümü Hızlandırmak için EuroShop 2026’da En Yeni Akıllı Perakende Çözümlerini Tanıttı

İsrail’in Lübnan’daki Hava Saldırıları Devam Ediyor

İsrail Saldırılarında Yeni Can Kayıpları

Bakanlıktan Yapılan Açıklamaya Göre İHA Saldırıları Engellendi

ABD Dışişleri Bakanlığı, Suudi Arabistan’daki Büyükelçilik Personeline Güvenlik Uyarısı Yaptı

İsrail’in Lübnan Saldırılarında Beyaz Fosfor Kullanımı Endişe Yaratıyor

Grant Thornton’un İş Dünyasında Kadınlar 2026 Raporu yayımlandı

Sms Onay Hizmetleri ile SMS Onay ve Sanal

LÜBNAN DIŞİŞLERİ BAKANI RECCİ: “İRAN’IN SALDIRILARI ULUSLARARASI NORMLARA AYKIRI”

HAREC’TE ASKERİ MÜHİMMAT DÜŞTÜ: 2 KİŞİ HAYATINI KAYBETTİ

--:--:--

İcaro Labs’un Yayımladığı Çalışmaya Göre Şiir, Büyük Dil Modellerinde Güvenlik Filtrelerini Aşabiliyor

Sayfahaber 02 Aralık 2025

0 Yorum Yapıldı

Bağlantı kopyalandı!

İcaro Labs tarafından yapılan ve “Adversarial Poetry as a Universal Single-Turn Jailbreak Mechanism in Large Language Models” başlığını taşıyan bir çalışma, araştırmacıların klasik konuşma dilinden ziyade şiirsel bir biçimde yazılmış talimatlar kullanarak güvenlik filtrelerini aşabildiğini ortaya koydu.

Yasaklı İçeriklere Erişim Sağlandı

Araştırmacılar, Wired‘ın aktardığına göre, kullandıkları şiirsel komutların detaylarını paylaşmamayı tercih etti. Ekibe göre bu komutların açıklanması son derece tehlikeli sonuçlar doğurabilir. Laboratuvar, yapılan denemeler sonucunda şiirsel komutlar kullanılarak yasaklı içeriklere erişilebildiğini belirtti.

Popüler Yapay Zeka Sistemleri Üzerinde Test Edildi

Araştırma ekibi, yöntemi OpenAI‘nin ChatGPT‘si, Google‘ın Gemini‘si, Anthropic‘in Claude‘u ve diğer büyük modeller üzerinde denedi. Sonuçlara göre:

Google Gemini, DeepSeek ve MistralAI gibi modeller, şiirsel komutlara karşı en hassas sistemler arasında yer aldı.
OpenAI‘nin ChatGPT modeli (GPT-5) ve Anthropic‘in Claude Haiku 4.5 modeli, güvenlik önlemlerini en iyi koruyan sistemler olarak öne çıktı.

Yapay Zeka Güvenliği Önemli Bir Konu Haline Geliyor

Uzmanlar, bu bulguların yapay zekânın denetlenmesi ve güvenlik sistemlerinin geliştirilmesi gerekliliğini vurguluyor. Şirketler, modellerinin tehlikeli içerikler üretmesini engellemek için daha güçlü güvenlik önlemlerine odaklanıyor.

PUTİN’DEN ENERJİ SEKTÖRÜ AÇIKLAMALARI

İRAN DEVRİM MUHAFIZLARI ORDUSU’NDAN SERT AÇIKLAMA

İSRAİL HAVALANDIRMA SİSTEMLERİ İRAN FÜZELERİNİ ÖNLEDİ

Bahreyn İçişleri Bakanlığı: İran’ın Saldırısında 1 Kişi Hayatını Kaybetti

ABD Başkanı Trump, İran’ın Nükleer ve Balistik Füze Kapasitesini Değerlendirdi

Ülkenin Orta Kesimlerindeki Fırtına ve Kasırgalar Ağır Hasara Yol Açtı

İzmir' de Haberin Doğru Adresi

Reklam & İşbirliği : [email protected]

Hakkımızda

Copyright © 2025 Tüm hakları SAYFA HABER' de saklıdır. Seobaz Haber Teması