Enterprise Yapay Zeka Ajanları: Mimari Katmanlar ve Tasarım Prensipleri

Özet

Yapay zeka ajan sistemleri, basit dil modeli çıktılarının çok ötesine geçerek kurumsal süreçleri özerk biçimde yürüten yapılara dönüşmektedir. Bu makalede, başarılı bir ajan mimarisinin on temel bileşeni — Büyük Dil Modeli temelinden tam özerk çalışmaya uzanan bir katman hiyerarşisi içinde — mimari gerekçeleri, tasarım karar noktaları ve yaygın uygulama hataları perspektifinden incelenmektedir. Makalenin birincil kitlesi, bu sistemleri tasarlamaya ya da değerlendirmeye başlayan teknik pratisyenler ve teknik karar vericilerdir.

1. Giriş

Büyük Dil Modelleri (LLM), metin üretme, özetleme ve soru yanıtlama gibi görevlerde olağanüstü performans sergilemektedir. Ancak bu modeller tek başlarına durum bilgisiz (stateless), araçsız ve tek turlu sistemlerdir: Her çıktı, geçmiş etkileşimlerden bağımsız olarak yalnızca gelen girdiye dayanır.

Kurumsal bağlamlarda beklentiler çok daha yüksektir. Süreçler çok adımlıdır, veri kaynaklarına erişim gereklidir, kararlar zaman içinde tutarlı olmalıdır ve sistem hataları tolere edilebilir biçimde yönetilmelidir. Bu boşluğu kapatmak için ajan mimarisi devreye girer.

Bu makale, bir ajan sistemini oluşturan on katmanı — her birinin mimari gerekçesi, tipik tasarım alternatifleri ve başarısızlık modları dahilinde — sistematik biçimde ele almaktadır.

Temel Katman

Adımlar 1–3

2. Büyük Dil Modeli — Temel Motor

2.1 Teknik Konum

LLM, ajan mimarisinin çıkarım motorudur. Doğal dil anlama, yapılandırılmış çıktı üretme, araç seçimi ve planın sözel ifadesinden sorumludur. Ancak doğrudan hafıza, durum yönetimi veya yan etki (side effect) üretme kapasitesi yoktur.

Mimari not: LLM'i bir "akıl yürütme çekirdeği" olarak konumlandırın; yürütme altyapısı değil. İş mantığı LLM prompt'ta değil, çevreleyen mimaride yaşamalıdır.

2.2 Model Seçim Kriterleri

Kurumsal ajan geliştirmede model seçimi dört boyutta değerlendirilir:

Bağlam penceresi (context window): Uzun belgeler, çok turlu diyaloglar veya ayrıntılı araç şemaları için 128k+ token destekli modeller tercih edilmelidir.
Araç çağrısı kalitesi: Modelin JSON şemasına uygun, tutarlı araç çağrısı üretip üretemediği kritiktir. Zayıf tool-calling, ajan döngüsünü kırar.
Çıktı tutarlılığı: Belirleyici (düşük temperature) ayarlarda yapılandırılmış çıktı kalitesi, pipeline güvenilirliğini doğrudan etkiler.
Gecikme ve maliyet dengesi: Tüm adımlar için büyük modeller kullanmak yerine rota bazlı model seçimi maliyet verimliliği sağlar.

3. API ve Dış Veri Erişimi — Kurumsal Entegrasyon Katmanı

3.1 Bağlantı Modelleri

Ajan sistemleri dış dünyayla üç temel yolla etkileşir: okuma (retrieval), yazma/güncelleme (action) ve olay dinleme (event). Her bağlantı türü farklı güvenlik ve hata yönetimi gereksinimleri taşır.

Okuma bağlantıları: Veritabanı sorguları, dosya sistemi erişimi, REST API GET çağrıları. Genellikle salt okunur izinle sınırlandırılmalıdır.
Yazma bağlantıları: CRM güncellemeleri, e-posta gönderimi, takvim yaratımı. Her yazma işlemi denetlenebilir (auditable) olmalı ve onay mekanizması içermelidir.
Olay bağlantıları: Webhook dinleme, mesaj kuyruğu tüketimi. Ajan tepkisel (reactive) modda çalışır.

3.2 Yaygın Mimari Hata

API entegrasyonunu "tamamlandı" saymak için bağlantının kurulması yeterli değildir. Hata yönetimi (retry, circuit breaker), oran sınırlaması (rate limiting) ve yetki kapsamı (least-privilege) baştan tasarlanmazsa, ajan yük altında ya da sınır senaryolarında öngörülemeyen biçimde davranır.

4. RAG — Bilgi Gruplama Mimarisi

4.1 RAG'ın Mimari Rolü

Retrieval-Augmented Generation (RAG), LLM'in eğitim kesiminden sonraki bilgilere veya kuruma özgü verilere erişimini sağlar. Temel fikir: modeli yeniden eğitmek yerine, çıkarım zamanında ilgili bilgiyi bağlama enjekte et.

Belge işleme (ingestion): Kaynak belgeler temizlenir, anlamlı parçalara (chunk) bölünür ve vektör temsilleri hesaplanarak vektör veritabanına yüklenir.
Sorgu zamanı geri getirme (retrieval): Kullanıcı girdisi embedding'e dönüştürülür, vektör veritabanında anlam benzerliğine göre en yakın parçalar bulunur.
Bağlam enjeksiyonu: Bulunan parçalar LLM prompt'una eklenerek model yalnızca bu bilgiye dayalı yanıt üretmesi yönlendirilir.

4.2 Tasarım Karar Noktaları

Chunk stratejisi: Sabit boyutlu (fixed-size) chunking hızlıdır ancak anlam sınırlarını keser. Anlamsal (semantic) chunking daha yüksek kalite sağlar, hesaplama maliyeti artar.
Embedding modeli: Domain-specific embedding modelleri teknik veya sektörel içerikte belirgin performans farkı yaratır.
Yeniden sıralama (reranking): İlk geri getirme sonrasında çapraz kodlayıcı ile yeniden sıralama hassasiyeti artırır, gecikmeyi yükseltir.

Kritik gerçek: RAG halüsinasyonu ortadan kaldırmaz. Yanlış veya çelişkili belgeler yüklüyse model bu bilgileri tutarlı biçimde kullanır. Veri kalitesi, model kalitesinden daha belirleyicidir.

Orta Katman

Adımlar 4–8

5. Bağlam Yönetimi — Oturum Sürekliliği

5.1 Stateless Sorun

LLM'ler doğası gereği stateless'tır: Her API çağrısı bağımsız. Çok turlu konuşma veya çok adımlı iş akışı için geçmişin dış bir sistemde tutulup her çağrıya eklenmesi gerekir. Bu bağlam yönetimi katmanının görevidir.

5.2 Bağlam Penceresi Yönetimi

Pencere kırpma (sliding window): Yalnızca son N tur tutulur. Basit ama erken konuşma bağlamını kaybeder.
Özetleme (summarization): Eski turlar LLM ile özetlenerek sıkıştırılır. Bağlam korunur, token maliyeti düşer; özetleme kalitesi kritik hale gelir.
Vektör tabanlı bellek entegrasyonu: Tüm konuşma tarihçesi vektör veritabanına yüklenir, her turda ilgili geçmiş geri getirilir. En esnek ama en karmaşık yaklaşım.

6. Bellek Mekanizmaları — Kalıcı Öğrenme Altyapısı

6.1 Bellek Taksonomisi

Anlık bellek (working memory): Aktif görev bağlamı; konuşma geçmişi ve ara sonuçlar. LLM bağlam penceresinde yaşar.
Epizodik bellek (episodic memory): Geçmiş oturum ve olayların kaydı. Vektör veritabanında saklanır, anlam benzerliğiyle geri getirilir.
Anlamsal bellek (semantic memory): Olgusal bilgi tabanı; kullanıcı tercihleri, politikalar, domain bilgisi. Yapılandırılmış veritabanında tutulur.
Prosedürel bellek (procedural memory): Başarılı araç çağrısı dizileri ve iş akışları. Fine-tuning veya few-shot örnek olarak kullanılabilir.

Bellek ve bağlam yönetimi atlanarak araç kullanımına geçildiğinde, ajan her oturumda geçmiş kararlardan habersiz başlar. Bu durum çelişkili aksiyonlara, kullanıcı tercihlerinin yok sayılmasına ve hata döngülerine yol açar.

7. Araç Kullanımı — Aksiyon Katmanı

7.1 Mimari Önemi

Bu katman, ajan mimarisindeki kırılma noktasıdır. Araç kullanımı öncesinde sistem bir metin üreteciydi; sonrasında gerçek dünyada yan etki yaratan bir aktördür.

Okuma araçları: Dış sistemlerden bilgi çeker: web arama, veritabanı sorgusu, dosya okuma, API GET çağrısı.
Yazma araçları: Dış sistemlerde değişiklik yapar: e-posta gönderme, veritabanı güncelleme, dosya yaratma, API POST/PUT/DELETE çağrısı.

7.2 Araç Tanımı Kalitesi

Araç çağrısı kalitesi büyük ölçüde araç açıklamasının kalitesine bağlıdır. İyi bir araç tanımı şunları içerir:

Ne yaptığını tek cümleyle açıklar
Hangi girdilerin zorunlu, hangilerin isteğe bağlı olduğunu belirtir
Döndürdüğü çıktının yapısını tanımlar
Hangi durumlarda kullanılmaması gerektiğini belirtir

7.3 Güvenlik ve Onay Mekanizması

Kritik tasarım ilkesi: Geri alınamaz (irreversible) yazma işlemleri için insan onay adımı (human-in-the-loop) zorunludur. "E-posta gönder", "ödeme yap", "kaydı sil" gibi aksiyonlar onay kapısı olmadan üretim sistemine alınmamalıdır.

8. Çok Adımlı Akıl Yürütme — Planlama Motoru

8.1 Planlama Paradigmaları

ReAct (Reason + Act): Model her adımda hem akıl yürütür hem aksiyon alır. Şeffaf, takip edilebilir ama uzun görevlerde bağlam penceresi dolar.
Plan-and-Execute: Model önce tüm planı üretir, ardından adım adım uygular. Bütünsel planlama avantajı sunar; planın dinamik güncellenmesi zorlaşır.
Tree of Thoughts (ToT): Model paralel akıl yürütme dalları açar, değerlendirir ve en iyi yolu seçer. Daha güvenilir sonuçlar, çok daha yüksek token maliyeti.

8.2 Yeniden Planlama (Replanning)

Üretim sistemlerinde plan nadiren ilk taslakta tamamlanır. Yeniden planlama tetikleyicileri önceden tanımlanmalıdır: Araç hataları, beklenmedik çıktılar, kaynak erişim sorunları ve zaman aşımları planın revize edilmesini gerektirir.

9. Çoklu Ajan Orkestrasyonu — Koordinasyon Mimarisi

9.1 Ne Zaman Çoklu Ajan?

Farklı uzmanlık gerektiren alt görevler açıkça ayrışabiliyorsa
Paralel yürütme gerektiren bağımsız iş akışları mevcutsa
Tek ajan bağlam penceresi sınırı görev karmaşıklığı için yetersiz kalıyorsa
Denetim ve hesap verebilirlik farklı alt sistemler için ayrı tutulması gerekiyorsa

9.2 Orkestrasyon Modelleri

Hiyerarşik (orkestratör-işçi): Merkezi bir orkestratör ajan görevi alt ajanlara dağıtır ve sonuçları birleştirir. Kontrol nettir, tek hata noktası orkestratördür.
Akış tabanlı (pipeline): Ajanlar sıralı bir pipeline oluşturur. Basit, öngörülebilir ama esneklik sınırlıdır.
Eşler arası (peer-to-peer): Ajanlar birbirini doğrudan çağırır. Esnek ama hata ayıklaması karmaşıktır; döngüsel bağımlılık riski taşır.

9.3 Çerçeve Seçimi

LangGraph: Durum makinesi tabanlı, döngüsel iş akışları için güçlü. Karmaşık akış kontrolü gerektiren sistemler için uygundur.
CrewAI: Rol tabanlı ajan tanımı, hızlı prototipleme için erişilebilir; üretim ölçeklenebilirliği sınırlı olabilir.
AutoGen (Microsoft): Konuşma tabanlı çok ajan koordinasyonu. Kontrol akışı öngörülemeyen olabilir.

Orkestrasyona geçmeden önce bellek (Adım 5), bağlam (Adım 4) ve araç kullanımı (Adım 6) katmanları sağlam oturmalıdır. Temelsiz bir orkestrasyon gürültüdür; koordineli hata üretimi.

İleri Katman

Adımlar 9–10

10. Değerlendirme ve Geri Bildirim Döngüleri

10.1 Değerlendirme Boyutları

Görev tamamlama doğruluğu: Ajan verilen görevi doğru sonuçla tamamladı mı?
Araç çağrısı isabetliliği: Doğru araçlar doğru parametrelerle mi çağrıldı?
Gecikme ve kaynak verimliliği: Kaç LLM çağrısı yapıldı? Toplam gecikme ve token maliyeti nedir?
Hata yönetimi kalitesi: Sistem beklenmedik durumlarla nasıl başa çıktı?

10.2 Değerlendirme Yaklaşımları

LLM-as-judge: Bir değerlendirici LLM çıktıları önceden tanımlanmış kriterlere göre puanlar. Ölçeklenebilir ama değerlendirici modelin güvenilirliğine bağımlıdır.
Kural tabanlı metrikler: JSON şema doğruluğu, araç çağrısı başarı oranı, yanıt süresi. Hızlı ve güvenilir.
İnsan değerlendirmesi: Altın standart; ölçeklenemez. Kritik güvenlik senaryoları için ayrılmalıdır.

10.3 Geri Bildirim Hattı

Başarısız çağrıların loglanması ve örüntü analizi
A/B testi: Farklı prompt versiyonları veya model seçimleri karşılaştırması
İnce ayar (fine-tuning) için başarılı örüntülerin derlenmesi
Eşik tabanlı alarm: Başarı oranı belirli bir seviyenin altına düşünce otomatik eskalasyon

Kritik gerçek: Değerlendirme altyapısı olmayan sistemler zamanla sessizce kötüleşir. Geliştirme ekibi bunu ya kullanıcı şikayetinden ya da ciddi bir prodüksiyon hatasından öğrenir.

11. Tam Otonom Ajan — Mimarinin Çatısı

11.1 Özerkliğin Koşulları

"Otonom ajan" bir ürün özelliği değil, doğru temeller üzerine inşa edilmiş bir mimari sonuçtur. Özerklik yalnızca şu koşullar altında güvenli ve değerlidir:

Net görev tanımı: Ajanın ne yapması, ne yapmaması gerektiği açıkça tanımlanmış olmalıdır.
Gözlemlenebilirlik: Her karar ve aksiyon kayıt altına alınmalı, geriye dönük analiz mümkün olmalıdır.
İnsan müdahale kapıları: Belirsizlik skoru yüksek kararlar için eskalasyon mekanizması tasarlanmalıdır.
Geri alma kapasitesi: Yapılan aksiyonların mümkün olduğunca geri alınabilir (reversible) olması tercih edilmelidir.

11.2 Yaygın Başarısızlık Modları

Görev genişlemesi (task creep): Ajan orijinal görevin dışına çıkar. Net araç kapsamı ve yetki sınırları bu riski azaltır.
Hata döngüsü (error loop): Başarısız aksiyon tekrar denenir, döngü kırılana kadar devam eder. Üstel geri çekilme ve maksimum deneme sayısı sınırı zorunludur.
Bağlam kaybı: Uzun görevlerde önceki kararların bağlamı kaybolur. Bellek mimarisi bu riski doğrudan etkiler.
Halüsinasyon yayılması: LLM'in ürettiği yanlış bilgi araç çağrısına aktarılır. Araç çağrısı öncesi doğrulama adımı kritiktir.

12. Sonuç ve Tasarım Prensipleri

Bu makale boyunca incelenen on katmandan çıkan temel tasarım prensipleri:

Temeli atlama LLM, API erişimi ve RAG olmadan orta ya da ileri katmana geçmek sistemik hatalara zemin hazırlar.

Durum yönetimini ciddiye al Bağlam ve bellek katmanları, ajanın "akıllı" görünmesini sağlayan temel altyapıdır.

Araç tanımlarına yatırım yap Araç çağrısı kalitesi, büyük ölçüde araç açıklamasının kalitesiyle orantılıdır.

Değerlendirmeyi son bırakma Değerlendirme altyapısı geliştirme sürecinin başından kurulmalıdır.

Özerkliği kademeli artır İnsan müdahaleli moddan başlayarak güven eşiği karşılandıkça özerklik kapsamı genişletilmelidir.

Araç bağımsız prensipler Hangi LLM veya çerçeve kullanıldığından bağımsız — temel sorun mimaridir.

Yapay zeka ajan mimarisi, hızla olgunlaşan bir alandır. Burada ele alınan prensipler araç bağımsızdır: Hangi LLM, hangi vektör veritabanı veya hangi orkestrasyon çerçevesinin kullanıldığından bağımsız olarak geçerlidir. Çünkü temel sorun teknik değil, mimaridir. Ve her iyi mimari, temeli sağlam atmakla başlar.

Yaşar Başkaya — Bağımsız Araştırmacı Yazar

Bu makale, Bir Yapay Zeka Ajanı Nasıl İnşa Edilir? başlıklı blog yazısının teknik genişlemesidir.

Blog yazısına yasarbaskaya.com adresinden ulaşabilirsiniz.