Amerikalı yapay zeka geliştiricisi Anthropic, aralarında DeepSeek, Moonshot ve MiniMax’in de bulunduğu üç büyük Çinli şirketi, kendi yapay zeka modellerini geliştirmek amacıyla “endüstriyel ölçekte kopyalama” yapmakla suçladı. İddialara göre bu şirketler, Anthropic’in Claude modelinin yeteneklerini kopyalamak için 24 bin sahte hesap üzerinden toplam 16 milyon veri alışverişi gerçekleştirdi.

“Damıtma” Yöntemi ve Güvenlik Riskleri

Yapay zeka sektöründe “damıtma” (distillation) olarak bilinen yöntem, daha küçük veya düşük kapasiteli bir modelin, sıfırdan ham verilerle eğitilmek yerine daha güçlü ve gelişmiş bir modelin çıktıları kullanılarak eğitilmesi anlamına geliyor. Zaman ve maliyet tasarrufu sağlayan bu teknik sektörde genellikle meşru kabul edilse de, ağır kısıtlamalara tabi Çin merkezli şirketler tarafından kullanılması hem ABD ihracat kontrollerini hem de Anthropic’in son kullanıcı lisans sözleşmesini ihlal ediyor.

Anthropic tarafından yapılan açıklamada şu ifadelere yer verildi:

“Damıtma meşru bir yöntem olabilir: Yapay zeka laboratuvarları bunu müşterileri için daha küçük, daha ucuz modeller oluşturmak amacıyla kullanır. Ancak Amerikan modellerini yasa dışı bir şekilde damıtan yabancı laboratuvarlar, güvenlik önlemlerini devreden çıkararak elde ettikleri model yeteneklerini kendi askeri, istihbarat ve gözetleme sistemlerine entegre edebilir.”

“Hidra Kümeleri” ile Sızma Operasyonu

Anthropic’in raporuna göre, kopyalama işlemini gerçekleştiren şirketler “hidra kümeleri” (hydra cluster) adını verdikleri karmaşık ağlar kurdu. Bu ağlar, Anthropic’in API’sine ve üçüncü taraf bulut hizmetlerine yayılan çok sayıda hesaptan oluşuyordu.

Bir vakada, tek bir proxy ağının aynı anda 20 binden fazla sahte hesabı yönettiği tespit edildi. Şüpheliler dikkat çekmemek için veri çekme trafiğini sıradan kullanıcı isteklerinin arasına gizlemeye çalıştı. Ancak son derece yüksek hacimli, belirli yeteneklere odaklanan ve sürekli kendini tekrar eden komut (prompt) kalıpları bu operasyonu ele verdi. Standart bir son kullanıcı davranışından tamamen uzak olan bu modelleme, doğrudan yapay zeka eğitimine işaret ediyordu.

Şirketlerin Veri Çekme Faaliyetleri

Anthropic’in tespitlerine göre suçlanan üç şirketin faaliyet dökümü şu şekilde:

  • MiniMax: En büyük veri çekme operasyonunu yürüten şirket oldu. 13 milyonu aşkın veri alışverişiyle otonom kodlama ve sistem düzenleme yeteneklerine odaklandı. Anthropic yetkilileri, MiniMax’in operasyonunu henüz devam ederken tespit ettiklerini belirtiyor. Çarpıcı bir diğer detay ise, Anthropic yeni bir Claude modeli tanıttığında MiniMax’in yeni modelin yeteneklerini kopyalamak için trafiğinin neredeyse yarısını 24 saat içinde bu yeni versiyona yönlendirmiş olması.
  • Moonshot: Kimi modelleriyle tanınan şirket, 3.4 milyondan fazla işlem gerçekleştirdi. Yüzlerce sahte hesap kullanan şirketin hedefleri arasında aracı (agentic) akıl yürütme, araç kullanımı, kodlama, veri analizi ve bilgisayarla görme (computer vision) teknolojileri yer aldı. Moonshot’ın özellikle Claude’un akıl yürütme süreçlerini yeniden yapılandırmaya çalıştığı iddia ediliyor.
  • DeepSeek: 150 binden fazla işlem gerçekleştiren DeepSeek; akıl yürütme görevleri, ödül modelleri için rubrik tabanlı derecelendirme ve politik olarak hassas sorguların sansüre takılmadan yeniden yazılması gibi alanlara odaklandı. Şirketin, Claude’un “adım adım akıl yürütme” mantığını ortaya çıkarmak ve zincirleme düşünce eğitim verilerini elde etmek için özel komutlar tasarladığı gözlemlendi.

Alınan Yeni Güvenlik Önlemleri

Yaşanan bu ihlallerin ardından Anthropic, büyük ölçekli damıtma operasyonlarını zorlaştırmak ve daha erken tespit edebilmek için savunma sistemlerini güçlendirdi. Şirket, API trafiğindeki koordineli hesap hareketlerini ve kopyalama kalıplarını belirlemek üzere davranışsal parmak izi ve yeni sınıflandırıcı sistemler devreye soktu.

Genellikle sahte erişim sağlamak için suistimal edilen eğitim, araştırma ve startup hesaplarının doğrulama süreçleri sıkılaştırıldı. Anthropic ayrıca, bu tür büyük ölçekli saldırılara karşı koymanın sektör çapında koordineli bir politika gerektirdiğini vurgulayarak, tespit edilen teknik göstergeleri diğer yapay zeka laboratuvarları, bulut sağlayıcıları ve resmi makamlarla paylaştığını bildirdi.