Anthropic verileri açıkladı: AI araç kullanımının yarısı yazılımdan geliyor

Anthropic tarafından paylaşılan yeni verilere göre, Public API üzerinden gerçekleştirilen araç çağrılarının yaklaşık yarısı yazılım mühendisliği alanından geliyor. Müşteri hizmetleri, satış, finans ve e-ticaret gibi diğer sektörlerin her biri ise yalnızca birkaç puanlık paya sahip.
Bu tablo, üretken yapay zekânın özellikle yazılım geliştirme süreçlerinde yoğun biçimde konumlandığını gösteriyor.
Claude Code’un otonomi süresi uzadı
Şirketin verileri, Claude Code’un bağımsız çalışma süresinde de dikkat çekici bir artış olduğunu ortaya koyuyor. Üç ay önce 25 dakikanın altında olan kesintisiz otonom çalışma süresi, artık 45 dakikanın üzerine çıkmış durumda.
Bu artış, yapay zekâ sistemlerinin daha uzun ve karmaşık görevleri insan müdahalesi olmadan sürdürebildiğine işaret ediyor.
OpenAI: Değişim yalnızca yeni modellerle sınırlı değil
OpenAI ise otonomideki artışın yalnızca en yeni ve yüksek performanslı modellere bağlı olmadığını belirtiyor. Şirkete göre bu gelişme, yeni model denemelerinden ziyade daha geniş çaplı bir “agentic AI” (ajan temelli yapay zekâ) yaklaşımına geçişin sonucu.
Kullanıcı güveni artıyor ancak tam kapasite kullanılmıyor
OpenAI’nin yayımladığı blog yazısında, kullanıcıların görevler daha karmaşık hâle geldikçe yapay zekâya daha fazla güvenmeye başladığı ifade ediliyor. Buna karşın “deployment overhang” olarak tanımlanan bir durum dikkat çekiyor: Modellerin yetenekleri, kullanıcıların fiilen izin verdiği kullanım senaryolarının önünde ilerliyor.
Bağımsız değerlendirmeler de uygun koşullar altında modellerin çok daha uzun görevleri başarıyla tamamlayabildiğini gösteriyor.
Karmaşık görevlerde insan denetimi azalıyor
Kodlama tarafında dikkat çeken bir diğer nokta ise görev karmaşıklığı arttıkça insan denetiminin azalması. Exploit keşfi veya derleyici yazımı gibi ileri seviye görevlerde insan gözetimi oranı yaklaşık yüzde 67 seviyesinde. Buna karşılık basit API görevlerinde bu oran yüzde 87’ye kadar çıkıyor.
Ayrıca Claude, yüksek karmaşıklıktaki görevlerde basit görevlere kıyasla yaklaşık iki kat daha fazla açıklayıcı soru yöneltiyor. Bu yaklaşım, belirsizlikleri azaltma ve doğru sonuca ulaşma açısından önemli bir strateji olarak değerlendiriliyor.
Belirsizliği tanıyan modeller ön planda olacak
Anthropic, ileriye dönük olarak modellerin belirsizliği tanıyabilmesi ve gerektiğinde proaktif biçimde açıklama istemesinin kritik olduğunu vurguluyor. Şirket ayrıca her eylem için manuel onay zorunluluğu getirilmesini önermiyor. Buna göre sürekli insan onayı talep etmek, güvenliği anlamlı ölçüde artırmadan süreci yavaşlatabiliyor.







