1. Giriş
Büyük Dil Modelleri (LLM), metin üretme, özetleme ve soru yanıtlama gibi görevlerde olağanüstü performans sergilemektedir. Ancak bu modeller tek başlarına durum bilgisiz (stateless), araçsız ve tek turlu sistemlerdir: Her çıktı, geçmiş etkileşimlerden bağımsız olarak yalnızca gelen girdiye dayanır.
Kurumsal bağlamlarda beklentiler çok daha yüksektir. Süreçler çok adımlıdır, veri kaynaklarına erişim gereklidir, kararlar zaman içinde tutarlı olmalıdır ve sistem hataları tolere edilebilir biçimde yönetilmelidir. Bu boşluğu kapatmak için ajan mimarisi devreye girer.
Bu makale, bir ajan sistemini oluşturan on katmanı — her birinin mimari gerekçesi, tipik tasarım alternatifleri ve başarısızlık modları dahilinde — sistematik biçimde ele almaktadır.
2. Büyük Dil Modeli — Temel Motor
2.1 Teknik Konum
LLM, ajan mimarisinin çıkarım motorudur. Doğal dil anlama, yapılandırılmış çıktı üretme, araç seçimi ve planın sözel ifadesinden sorumludur. Ancak doğrudan hafıza, durum yönetimi veya yan etki (side effect) üretme kapasitesi yoktur.
2.2 Model Seçim Kriterleri
Kurumsal ajan geliştirmede model seçimi dört boyutta değerlendirilir:
- Bağlam penceresi (context window): Uzun belgeler, çok turlu diyaloglar veya ayrıntılı araç şemaları için 128k+ token destekli modeller tercih edilmelidir.
- Araç çağrısı kalitesi: Modelin JSON şemasına uygun, tutarlı araç çağrısı üretip üretemediği kritiktir. Zayıf tool-calling, ajan döngüsünü kırar.
- Çıktı tutarlılığı: Belirleyici (düşük temperature) ayarlarda yapılandırılmış çıktı kalitesi, pipeline güvenilirliğini doğrudan etkiler.
- Gecikme ve maliyet dengesi: Tüm adımlar için büyük modeller kullanmak yerine rota bazlı model seçimi maliyet verimliliği sağlar.
3. API ve Dış Veri Erişimi — Kurumsal Entegrasyon Katmanı
3.1 Bağlantı Modelleri
Ajan sistemleri dış dünyayla üç temel yolla etkileşir: okuma (retrieval), yazma/güncelleme (action) ve olay dinleme (event). Her bağlantı türü farklı güvenlik ve hata yönetimi gereksinimleri taşır.
- Okuma bağlantıları: Veritabanı sorguları, dosya sistemi erişimi, REST API GET çağrıları. Genellikle salt okunur izinle sınırlandırılmalıdır.
- Yazma bağlantıları: CRM güncellemeleri, e-posta gönderimi, takvim yaratımı. Her yazma işlemi denetlenebilir (auditable) olmalı ve onay mekanizması içermelidir.
- Olay bağlantıları: Webhook dinleme, mesaj kuyruğu tüketimi. Ajan tepkisel (reactive) modda çalışır.
3.2 Yaygın Mimari Hata
4. RAG — Bilgi Gruplama Mimarisi
4.1 RAG'ın Mimari Rolü
Retrieval-Augmented Generation (RAG), LLM'in eğitim kesiminden sonraki bilgilere veya kuruma özgü verilere erişimini sağlar. Temel fikir: modeli yeniden eğitmek yerine, çıkarım zamanında ilgili bilgiyi bağlama enjekte et.
- Belge işleme (ingestion): Kaynak belgeler temizlenir, anlamlı parçalara (chunk) bölünür ve vektör temsilleri hesaplanarak vektör veritabanına yüklenir.
- Sorgu zamanı geri getirme (retrieval): Kullanıcı girdisi embedding'e dönüştürülür, vektör veritabanında anlam benzerliğine göre en yakın parçalar bulunur.
- Bağlam enjeksiyonu: Bulunan parçalar LLM prompt'una eklenerek model yalnızca bu bilgiye dayalı yanıt üretmesi yönlendirilir.
4.2 Tasarım Karar Noktaları
- Chunk stratejisi: Sabit boyutlu (fixed-size) chunking hızlıdır ancak anlam sınırlarını keser. Anlamsal (semantic) chunking daha yüksek kalite sağlar, hesaplama maliyeti artar.
- Embedding modeli: Domain-specific embedding modelleri teknik veya sektörel içerikte belirgin performans farkı yaratır.
- Yeniden sıralama (reranking): İlk geri getirme sonrasında çapraz kodlayıcı ile yeniden sıralama hassasiyeti artırır, gecikmeyi yükseltir.
5. Bağlam Yönetimi — Oturum Sürekliliği
5.1 Stateless Sorun
LLM'ler doğası gereği stateless'tır: Her API çağrısı bağımsız. Çok turlu konuşma veya çok adımlı iş akışı için geçmişin dış bir sistemde tutulup her çağrıya eklenmesi gerekir. Bu bağlam yönetimi katmanının görevidir.
5.2 Bağlam Penceresi Yönetimi
- Pencere kırpma (sliding window): Yalnızca son N tur tutulur. Basit ama erken konuşma bağlamını kaybeder.
- Özetleme (summarization): Eski turlar LLM ile özetlenerek sıkıştırılır. Bağlam korunur, token maliyeti düşer; özetleme kalitesi kritik hale gelir.
- Vektör tabanlı bellek entegrasyonu: Tüm konuşma tarihçesi vektör veritabanına yüklenir, her turda ilgili geçmiş geri getirilir. En esnek ama en karmaşık yaklaşım.
6. Bellek Mekanizmaları — Kalıcı Öğrenme Altyapısı
6.1 Bellek Taksonomisi
- Anlık bellek (working memory): Aktif görev bağlamı; konuşma geçmişi ve ara sonuçlar. LLM bağlam penceresinde yaşar.
- Epizodik bellek (episodic memory): Geçmiş oturum ve olayların kaydı. Vektör veritabanında saklanır, anlam benzerliğiyle geri getirilir.
- Anlamsal bellek (semantic memory): Olgusal bilgi tabanı; kullanıcı tercihleri, politikalar, domain bilgisi. Yapılandırılmış veritabanında tutulur.
- Prosedürel bellek (procedural memory): Başarılı araç çağrısı dizileri ve iş akışları. Fine-tuning veya few-shot örnek olarak kullanılabilir.
7. Araç Kullanımı — Aksiyon Katmanı
7.1 Mimari Önemi
Bu katman, ajan mimarisindeki kırılma noktasıdır. Araç kullanımı öncesinde sistem bir metin üreteciydi; sonrasında gerçek dünyada yan etki yaratan bir aktördür.
- Okuma araçları: Dış sistemlerden bilgi çeker: web arama, veritabanı sorgusu, dosya okuma, API GET çağrısı.
- Yazma araçları: Dış sistemlerde değişiklik yapar: e-posta gönderme, veritabanı güncelleme, dosya yaratma, API POST/PUT/DELETE çağrısı.
7.2 Araç Tanımı Kalitesi
Araç çağrısı kalitesi büyük ölçüde araç açıklamasının kalitesine bağlıdır. İyi bir araç tanımı şunları içerir:
- Ne yaptığını tek cümleyle açıklar
- Hangi girdilerin zorunlu, hangilerin isteğe bağlı olduğunu belirtir
- Döndürdüğü çıktının yapısını tanımlar
- Hangi durumlarda kullanılmaması gerektiğini belirtir
7.3 Güvenlik ve Onay Mekanizması
8. Çok Adımlı Akıl Yürütme — Planlama Motoru
8.1 Planlama Paradigmaları
- ReAct (Reason + Act): Model her adımda hem akıl yürütür hem aksiyon alır. Şeffaf, takip edilebilir ama uzun görevlerde bağlam penceresi dolar.
- Plan-and-Execute: Model önce tüm planı üretir, ardından adım adım uygular. Bütünsel planlama avantajı sunar; planın dinamik güncellenmesi zorlaşır.
- Tree of Thoughts (ToT): Model paralel akıl yürütme dalları açar, değerlendirir ve en iyi yolu seçer. Daha güvenilir sonuçlar, çok daha yüksek token maliyeti.
8.2 Yeniden Planlama (Replanning)
Üretim sistemlerinde plan nadiren ilk taslakta tamamlanır. Yeniden planlama tetikleyicileri önceden tanımlanmalıdır: Araç hataları, beklenmedik çıktılar, kaynak erişim sorunları ve zaman aşımları planın revize edilmesini gerektirir.
9. Çoklu Ajan Orkestrasyonu — Koordinasyon Mimarisi
9.1 Ne Zaman Çoklu Ajan?
- Farklı uzmanlık gerektiren alt görevler açıkça ayrışabiliyorsa
- Paralel yürütme gerektiren bağımsız iş akışları mevcutsa
- Tek ajan bağlam penceresi sınırı görev karmaşıklığı için yetersiz kalıyorsa
- Denetim ve hesap verebilirlik farklı alt sistemler için ayrı tutulması gerekiyorsa
9.2 Orkestrasyon Modelleri
- Hiyerarşik (orkestratör-işçi): Merkezi bir orkestratör ajan görevi alt ajanlara dağıtır ve sonuçları birleştirir. Kontrol nettir, tek hata noktası orkestratördür.
- Akış tabanlı (pipeline): Ajanlar sıralı bir pipeline oluşturur. Basit, öngörülebilir ama esneklik sınırlıdır.
- Eşler arası (peer-to-peer): Ajanlar birbirini doğrudan çağırır. Esnek ama hata ayıklaması karmaşıktır; döngüsel bağımlılık riski taşır.
9.3 Çerçeve Seçimi
- LangGraph: Durum makinesi tabanlı, döngüsel iş akışları için güçlü. Karmaşık akış kontrolü gerektiren sistemler için uygundur.
- CrewAI: Rol tabanlı ajan tanımı, hızlı prototipleme için erişilebilir; üretim ölçeklenebilirliği sınırlı olabilir.
- AutoGen (Microsoft): Konuşma tabanlı çok ajan koordinasyonu. Kontrol akışı öngörülemeyen olabilir.
10. Değerlendirme ve Geri Bildirim Döngüleri
10.1 Değerlendirme Boyutları
- Görev tamamlama doğruluğu: Ajan verilen görevi doğru sonuçla tamamladı mı?
- Araç çağrısı isabetliliği: Doğru araçlar doğru parametrelerle mi çağrıldı?
- Gecikme ve kaynak verimliliği: Kaç LLM çağrısı yapıldı? Toplam gecikme ve token maliyeti nedir?
- Hata yönetimi kalitesi: Sistem beklenmedik durumlarla nasıl başa çıktı?
10.2 Değerlendirme Yaklaşımları
- LLM-as-judge: Bir değerlendirici LLM çıktıları önceden tanımlanmış kriterlere göre puanlar. Ölçeklenebilir ama değerlendirici modelin güvenilirliğine bağımlıdır.
- Kural tabanlı metrikler: JSON şema doğruluğu, araç çağrısı başarı oranı, yanıt süresi. Hızlı ve güvenilir.
- İnsan değerlendirmesi: Altın standart; ölçeklenemez. Kritik güvenlik senaryoları için ayrılmalıdır.
10.3 Geri Bildirim Hattı
- Başarısız çağrıların loglanması ve örüntü analizi
- A/B testi: Farklı prompt versiyonları veya model seçimleri karşılaştırması
- İnce ayar (fine-tuning) için başarılı örüntülerin derlenmesi
- Eşik tabanlı alarm: Başarı oranı belirli bir seviyenin altına düşünce otomatik eskalasyon
11. Tam Otonom Ajan — Mimarinin Çatısı
11.1 Özerkliğin Koşulları
"Otonom ajan" bir ürün özelliği değil, doğru temeller üzerine inşa edilmiş bir mimari sonuçtur. Özerklik yalnızca şu koşullar altında güvenli ve değerlidir:
- Net görev tanımı: Ajanın ne yapması, ne yapmaması gerektiği açıkça tanımlanmış olmalıdır.
- Gözlemlenebilirlik: Her karar ve aksiyon kayıt altına alınmalı, geriye dönük analiz mümkün olmalıdır.
- İnsan müdahale kapıları: Belirsizlik skoru yüksek kararlar için eskalasyon mekanizması tasarlanmalıdır.
- Geri alma kapasitesi: Yapılan aksiyonların mümkün olduğunca geri alınabilir (reversible) olması tercih edilmelidir.
11.2 Yaygın Başarısızlık Modları
- Görev genişlemesi (task creep): Ajan orijinal görevin dışına çıkar. Net araç kapsamı ve yetki sınırları bu riski azaltır.
- Hata döngüsü (error loop): Başarısız aksiyon tekrar denenir, döngü kırılana kadar devam eder. Üstel geri çekilme ve maksimum deneme sayısı sınırı zorunludur.
- Bağlam kaybı: Uzun görevlerde önceki kararların bağlamı kaybolur. Bellek mimarisi bu riski doğrudan etkiler.
- Halüsinasyon yayılması: LLM'in ürettiği yanlış bilgi araç çağrısına aktarılır. Araç çağrısı öncesi doğrulama adımı kritiktir.
12. Sonuç ve Tasarım Prensipleri
Bu makale boyunca incelenen on katmandan çıkan temel tasarım prensipleri:
Yapay zeka ajan mimarisi, hızla olgunlaşan bir alandır. Burada ele alınan prensipler araç bağımsızdır: Hangi LLM, hangi vektör veritabanı veya hangi orkestrasyon çerçevesinin kullanıldığından bağımsız olarak geçerlidir. Çünkü temel sorun teknik değil, mimaridir. Ve her iyi mimari, temeli sağlam atmakla başlar.
