AURA - AI Risk Assessment
KoçSistem Bilgi ve İletişim Hiz. A.Ş.
AURA - AI Risk Assessment
Proje İçeriği
AURA (AI Risk Assessment)
AURA, kurumların üretken yapay zeka (GenAI) ve büyük dil modelleri (LLM) tabanlı dijital asistanlarını canlıya almadan önce güvenliğini, doğruluğunu ve etik uyumunu test eden kapsamlı bir risk değerlendirme platformudur. Kurumların yapay zeka adaptasyonundaki en büyük engel olan "kara kutu" risklerini ortadan kaldırarak, modellerin sadece akıllı değil; aynı zamanda güvenli ve denetlenebilir olmasını sağlar.
Proje, manuel testlerin yetersiz kaldığı noktada devreye girerek 10.000’den fazla test verisi ve "Hakem olarak YZ" (LLM-as-a-judge) teknolojisi ile tam otomatik bir denetim süreci sunar. AURA, yapay zeka asistanlarını şu 4 temel güvenlik kalkanı altında zorlu senaryolarla sına tabi tutar:
• Toksisite ve Manipülasyon: Marka itibarını zedeleyebilecek ayrımcı, saldırgan dilin ve manipülatif söylemlerin tespiti.
• Prompt Injection Direnci: Kötü niyetli kullanıcıların sistemi kurallar dışına çıkarma (jailbreak) girişimlerine karşı güvenlik testi.
• RAG Doğruluğu: Kurumsal bilgi tabanından veri getirirken oluşan hataların anlamsal algoritmalarla (SBERT) ölçümü.
• Halüsinasyon Kontrolü: Yapay zekanın gerçek dışı bilgi uydurma riskinin analizi,.
AURA, global rakiplerinden ayrılarak Türkçe dilinin yapısal özelliklerine ve kültürel nüanslarına tam uyumlu özgün test setleri sunmasıyla benzersizdir. AB Yapay Zeka Yasası (EU AI Act) ve KVKK gibi regülasyonlarla uyumlu bir denetim mekanizması sağlayan platform; finans, e-ticaret ve üretim gibi kritik sektörlerde güvenli ölçeklenmenin önünü açar. Model bağımsız yapısı sayesinde OpenAI, Anthropic veya Google gibi farklı modellerle entegre çalışarak kurumların teknoloji yatırımlarını koruma altına alır.
Projenin Amacı
AURA projesi, hibrit bir strateji ile hem kurum içi kalite güvence süreçlerimizi otomatize etmek hem de pazardaki kritik bir boşluğu dolduracak yeni bir ticari hizmet (SaaS/Platform) yaratmak amacıyla geliştirilmiştir. Proje, KoçSistem'in kendi yapay zeka dönüşüm yolculuğunda karşılaştığı güvenlik ihtiyaçlarından doğmuş, ancak sahip olduğu yetkinliklerle sektörün geneline hitap eden bir ürüne evrilmiştir.
1. Kurum İçi Süreç İyileştirmesi: Öncelikle kendi geliştirdiğimiz üretken yapay zeka asistanlarının (örneğin; kurum içi asistanımız KAI gibi) canlıya alınmadan önceki test süreçlerini iyileştirmek hedeflenmiştir.
• Manuel Testlerin Otomasyonu: Kurum içinde geliştirdiğimiz dijital asistanların toksisite, halüsinasyon ve güvenlik açıklarını (prompt injection) manuel olarak test etmek sürdürülebilir ve ölçeklenebilir değildi. AURA, 10.000’den fazla test verisi ile bu süreci insan müdahalesine gerek kalmadan otomatize ederek, test sürelerini kısaltmış ve Kalite Güvence süreçlerimizin verimliliğini artırmıştır.
• Risk Yönetimi: Kendi markamızın itibarını korumak adına, asistanlarımızın yanlış bilgi üretme (halüsinasyon) veya manipüle edilme risklerini canlıya çıkmadan önce tespit eden bir güvenlik duvarı oluşturulmuştur. Bu sayede iç müşterilerimize sunduğumuz hizmetin güvenilirliği garanti altına alınmıştır.
2. Yeni Bir Hizmet Yaratımı (Ticari Ürün ve Pazar Fırsatı): Kurum içinde elde ettiğimiz bu yetkinlik, piyasadaki benzer ihtiyaçlar ve yerel regülasyonlara uyum zorunluluğu göz önüne alınarak ticari bir ürüne dönüştürülmüştür.
• Yerli ve Milli Platform İhtiyacı: Global rakiplerin (Azure AI, Lakera vb.) Türkçe dil desteği ve yerel kültürel nüanslardaki (toksisite algısı vb.) eksikliği tespit edilmiştir. AURA, Türkçe dilinin yapısal özelliklerine tam uyumlu "yerli" bir test platformu olarak dış pazara yeni bir hizmet olarak sunulmaktadır.
• Regülasyonlara Uyum Hizmeti: Başta Finans ve Sağlık olmak üzere regülasyonun yoğun olduğu sektörlere, KVKK ve yaklaşan Ulusal Yapay Zeka Stratejisi/AB AI Act uyumluluğunu denetleyen bir "Risk Değerlendirme Hizmeti" olarak konumlandırılmıştır.
Özetle; AURA, KoçSistem'in kendi "AI First" vizyonunu güvenle gerçekleştirmesini sağlayan bir iç araç olarak başlamış, ancak sahip olduğu benzersiz yetenekler ve pazarın "Güvenilir Yapay Zeka" (Trustworthy AI) ihtiyacı doğrultusunda sektöre sunulan stratejik bir ürüne dönüşmüştür.
Proje içindeki en büyük inovasyon nedir? (yeni bir teknoloji veya var olan teknolojinin farklı kullanımı gibi. IOT, M2M, AI vb.)
AURA projesinin en büyük inovasyonu; küresel pazarın İngilizce odaklı standartlarını aşarak, Türkçe dilinin eklemeli (agglutinative) ve morfolojik yapısına özel olarak geliştirilmiş ilk "Otomatik Yapay Zeka Risk Değerlendirme ve Güvenlik Platformu" olmasıdır. Mevcut global araçların (Azure AI, Lakera vb.) Türkçe’deki kültürel nüansları, toksisiteyi ve dilbilgisel saldırı vektörlerini (jailbreak) tespit etmekte yetersiz kaldığı noktada AURA, yerel dil modelleri ve regülasyonlar (KVKK) için özgün bir "Yapay Zeka Güvenlik Kalkanı" tanımlamıştır.
Bu temel inovasyon, aşağıdaki üç teknik ve mimari yenilikle desteklenmektedir:
1. Türkçe İçin Özgün Adversarial (Saldırgan) Test Veri Setleri: Mevcut global benchmarkların (MMLU, HELM vb.) çeviri ile Türkçeye uyarlanması, dilin yapısal özellikleri nedeniyle yetersiz kalmaktadır. AURA, Türkçenin dil bilgisi kurallarına uygun olarak "prompt injection" (sistemi kandırma) ve manipülasyon girişimlerini simüle eden özgün ve yerli test senaryoları geliştirmiştir. Bu, modelin sadece kelime bazlı değil, anlamsal ve kültürel bağlamda da güvenliğini test eden benzersiz bir Ar-Ge çıktısıdır.
2. Bütünleşik "4 Boyutlu" Risk Mimarisi: Sektördeki mevcut çözümler genellikle tek bir risk alanına (örneğin sadece halüsinasyon veya sadece siber güvenlik) odaklanırken, AURA dört kritik risk kategorisini (Toksisite, Prompt Injection, RAG Doğruluğu ve Halüsinasyon) tek bir platformda entegre etmiştir. Bu bütünleşik yapı, kurumların farklı araçlar kullanmak yerine tek bir merkezden tüm yapay zeka risklerini yönetmesini sağlayan inovatif bir orkestrasyon sunar.
3. "LLM-as-a-Judge" ve SBERT ile Tam Otomatik Skorlama: Proje, insan denetimine dayalı manuel test süreçlerini ortadan kaldıran "Hakem olarak YZ" (LLM-as-a-judge) teknolojisini ve SBERT (Sentence-BERT) algoritmalarını kullanır. Bu teknoloji, modelin ürettiği cevapların doğruluğunu ve güvenilirliğini, başka bir yapay zeka modeli ile anlamsal düzlemde (semantic similarity) milisaniyeler içinde ve matematiksel kesinlikle puanlayarak test süreçlerini %100 otomatize eder.
Proje kurum içindeki hangi bölüme fayda sağlamıştır?(satış, pazarlama, finans, İK, IT, Üretim, Planlama, Satın alma, Lojistik Müşteri İlişkileri gibi)
BT Bölümü, İK ve Kurum itibarı
Projenin hayata geçirilmesi konusunda üst yönetimin desteğini tam olarak alabildiniz mi?
Evet. Proje ilk andan itibaren Üst Yönetimin desteğini almıştır.
Proje sonunda ortaya çıkan sonuçları analiz edebildiniz mi? Rakamsal verilerle ifade eder misiniz?(ROI, maliyetlerde yüzdesel azalma, üretim süresinde azalma, hata payının düşmesi vs.)
Evet, projenin analiz yeteneklerini ve sonuçlarını, öncelikle KoçSistem’in kendi geliştirdiği üretken yapay zeka asistanı KAI üzerinde gerçekleştirdiğimiz kapsamlı pilot çalışmalarla doğruladık. AURA platformu, KAI’nin geliştirme yaşam döngüsüne entegre edilerek canlı ortamdaki performansı ve güvenliği somut verilerle analiz edilmiştir.
Bu analiz sürecinde şu metodoloji izlenmiştir:
• KAI ile Gerçek Hayat Senaryosu: KAI asistanının kullanıcı sorularına verdiği yanıtlar, AURA üzerindeki 4 temel risk kategorisinde (Toksisite, Prompt Injection, RAG Doğruluğu, Halüsinasyon) taranmış ve %78.67 genel başarı skoru, %82.5 toksisite direnci gibi somut metriklerle performans seviyesi ölçümlenmiştir.
• Değişiklik Yönetimi ve Regresyon Testi: KAI üzerinde yapılan her model güncellemesi, prompt değişikliği veya bilgi tabanı (knowledge base) yenilemesinin ardından AURA testleri otomatik olarak tetiklenmiştir. Sisteme eklediğimiz "Regresyon Testi" özelliği sayesinde, yeni yapılan bir değişikliğin asistanın önceki doğru cevaplarını bozup bozmadığı veya cevap kalitesini değiştirip değiştirmediği geçmiş test verileriyle kıyaslanarak kontrol edilmiştir.
Projenizde şirket içinden kaç kişi aktif olarak görev almıştır? Ekip birimleri hakkında kısaca bilgi verir misiniz?
8
Projenizde (varsa)işbirliği kurduğunuz veya destek aldığınız bilişim şirketlerini belirtiniz.
Tamamı kendi içimizde geliştirildi
Proje sırasında kullandığınız ve spesifik önemi olan markaları (varsa) belirtiniz. (Yazılım veya donanım markaları)
Open AI API key kullanılıyor. Bunun dışında 3rd Party bulunmamaktadır.
