
Yapay zeka ve veri bilimi projelerinde birçok ekip, modelden önce veriyle ilgili sorunlarda zorlanır: yanlış anlamlandırılmış alanlar, tutarsız etiketler, izlenebilir olmayan veri akışı (lineage) ve belirsiz sorumluluklar… Sonuçta ekipler aynı kelimeleri kullanıyor gibi görünse de farklı şeyleri kasteder. Bu rehberin amacı; veri kalitesi, etiketleme/annotation ve veri yönetimi/yönetişimi kelime dağarcığını pratik bir “ortak dil”e dönüştürmek ve bunu uygulanabilir bir stratejiye bağlamaktır.
Not: Standartlar ve rehberler arasında terminoloji farkları olabilir. Akademik literatür de “tek ve evrensel” bir boyut seti olmadığına işaret eder. Bu nedenle burada, yaygın ve birlikte çalışabilir bir yaklaşım önerilir; ekip içi sözlükle netleştirilmesi beklenir.
Pratikte bu üç alan birbirine bağlıdır: Yönetişim “kim-neye karar verir?” sorusunu, veri kalitesi “neyi iyi sayarız?” sorusunu, etiketleme ise “modelin gerçeğini nasıl tutarlı üretiriz?” sorusunu cevaplar.
“Veri kalitesi” çoğunlukla birden fazla boyutla açıklanır. DAMA’nın veri yönetimi terminolojisi ve akademik çerçeveler bu boyutların yaygın bir çekirdeği paylaştığını, ancak detaylarda farklılaştığını gösterir. Bazı standartlar ise belirli veri türlerine odaklanır.
Öneri: Projeniz için 6–10 boyutluk bir “kalite sözlüğü” seçin, her boyutu ölçüm yaklaşımı ve kabul kriteri ile tanımlayın. Bu, ekip içi tartışmaları hızlandırır ve veri borcunu (data debt) görünür kılar.
| Boyut | Kısa tanım | Günlük örnek (e-öğrenme / referans ürün) | Nasıl ölçülür? |
|---|---|---|---|
| Doğruluk (accuracy) | Değerin “gerçeğe” veya referans kaynağa uygunluğu | Sözlükte terim tanımının doğru kaynağa dayanması | Spot check, uzman incelemesi, çapraz doğrulama |
| Tamlık (completeness) | Gerekli alanların/örneklerin mevcut olması | Konu etiketi zorunlu olan içeriklerde boş etiket kalmaması | Boş/null oranı, zorunlu alan kontrolü |
| Tutarlılık (consistency) | Aynı kuralın her yerde aynı uygulanması | “Grade level” alanının bir yerde 6, bir yerde “sixth” gelmemesi | Şema/kurallar, veri kontratı, kural ihlali sayısı |
| Zamanlılık (timeliness) | Verinin ihtiyaç anında ulaşılabilir ve güncel olması | Yeni eklenen içeriklerin arama indeksine gecikmeden düşmesi | Gecikme SLA’ları, pipeline gecikme ölçümü |
| Güncellik (currency) | Bilginin “eski” olmaması; değişen gerçekliği yansıtması | Politika/teknoloji terimlerinin tanımlarının revizyon gerektirmesi | Son güncellenme tarihi, içerik yaş analizi |
| Benzersizlik (uniqueness) | Aynı kaydın tekrarlanmaması | Aynı ders içeriğinin iki farklı ID ile çoğalması | Dedup kuralları, benzerlik eşleştirme |
Bu boyutların bir kısmı DAMA’nın güncellenen terminolojisi ve akademik çerçevelerde tartışılır. Örnek kaynaklar: DAMA DMBOK revizyon notları, MDPI Data (2024) boyutlar çerçevesi.
Genel amaçlı kalite boyutları her veri türüne uygulanabilir; ancak sensör/IoT gibi alanlarda veri kalitesini, ölçüm ve kayıt koşullarına bağlı daha teknik karakteristiklerle ele almak gerekebilir. ISO 8000-210:2024, sensör verisi için veri kalite karakteristiklerini tanımlayan bir standarttır ve özellikle zaman serileri, cihaz kaynaklı ölçümler ve saha koşullarının etkilediği veri setlerinde ortak bir dil kurmaya yardımcı olabilir.
Sınır: ISO 8000-210:2024’ün kapsamı sensör verisine odaklanır; bu nedenle DAMA/akademik “genel boyut setleri”nin yerine geçmekten ziyade, sensör verisi söz konusu olduğunda bu setleri tamamlayıcı bir referans olarak düşünmek daha doğru olur.
Veri kalitesi çoğu zaman kullanım amacına göre tanımlanır. Örneğin bir öneri sistemi için küçük yazım hataları tolere edilebilirken, yüksek riskli kararlar içeren uygulamalarda aynı tolerans kabul edilemez. Bu nedenle “kabul edilebilir kalite” eşiği, ürün riskine ve kararın etkisine göre belirlenmelidir.
Bu ikisi birlikte kullanıldığında “beklenmeyen” değişimlere erken yakalanırsınız ve etiketleme ya da model performansındaki düşüşleri açıklamak kolaylaşır.
Etiketleme, eğitim verisinin “gerçeğini” tanımlar. Bu gerçek; sınıflandırma etiketi, kutu çizimi (bounding box), metin işaretleme, rubrik puanı, arama niyeti, içerik seviyesi gibi birçok biçimde olabilir. Etiketleme kalitesi düştüğünde modeliniz yanlış şeyi öğrenebilir.
Çok katmanlı kalite kontrol; çoklu etiketleme, adjudication, gold/sentinel örnekler ve IAA ölçümünü birlikte ele alır. Sahada kalite yönetimi pratikleri için: Computational Linguistics (MIT Press, 2024). Operasyonel yönerge ve iş akışı örnekleri için: Scale AI Data Labeling Guide.
Örnek: Bir e-öğrenme platformunda “Beginner/Intermediate/Advanced” seviyesi etiketleniyorsa, sadece konuya değil ön koşul bilgi tanımına da yer vermek gerekir. Aksi halde etiketleyiciler kendi eğitim geçmişlerine göre farklı kararlar verebilir.
IAA ölçmek, “etiketleyiciler tutarlı mı?” sorusunu yanıtlamaya yardım eder. Ancak iki noktaya dikkat edin:
Etiket hatalarını otomatik olarak işaretleyen yaklaşımlar, özellikle büyük veri setlerinde “inceleme kuyruğu” oluşturmak için faydalı olabilir. Örneğin cleanlab dokümantasyonu, model çıktıları üzerinden olası etiket sorunlarını belirleme ve bu örnekleri gözden geçirme akışlarını açıklar.
Sınır: Bu tür araçlar genellikle bir “önceliklendirme” sağlar; tek başına nihai karar mekanizması olarak düşünülmemelidir. Yüksek riskli alanlarda veya önemli kullanıcı etkisi olan etiketlerde, insan doğrulaması/adjudication süreci koruyucu bir katmandır.
“Data governance” sıklıkla politikalar ve karar mekanizmaları; “data management” ise bu kararların günlük operasyonu olarak düşünülür. Kurumsal ölçekte sürdürülebilir kalite için ikisi birlikte gereklidir.
NIST’in Research Data Framework (RDaF) v2.0 yayını, veri yaşam döngüsü ve yönetişim uygulamalarına yönelik bir çerçeve sunar. Araştırma bağlamında tasarlanmış olsa da, ürün ekiplerinin de şu pratik ihtiyaçlarına iyi oturur:
Bu ayrım net değilse “kalite problemi” hızlıca “kim çözecek?” problemine dönüşür.
Model performansında düşüş yaşadığınızda ilk sorulardan biri şudur: Hangi veri sürümüyle eğittik ve o veri nasıl üretildi? Bu soruya hızlı cevap verebilmek için:
“Data pipeline”, verinin toplanması, dönüştürülmesi ve tüketilmesi arasındaki süreçtir. Kaliteyi yalnızca en sonda kontrol etmek, hataları pahalı hale getirir. Bunun yerine kalite kontrolleri hattın içine yerleştirilmelidir.
Bu terimler, yönetişimle birleştiğinde “veri borcunu” azaltır: hangi alanın ne anlama geldiği, hangi dönüşümün neden yapıldığı ve hangi testlerin geçtiği görünür olur.
ABD pazarında her sektör için tek tip, bağlayıcı bir rejimden söz etmek zordur; ancak “güvenilir AI” beklentisi artar. AB tarafında ise AI Act gibi düzenlemeler, özellikle yüksek riskli sistemlerde veri yönetişimi ve kalite yönetimi beklentilerini daha somut hale getirir. Bağlam için: ISACA – Understanding the EU AI Act.
Uyum gereksinimleri hızla değişebilir. Bu bölüm hukuki danışmanlık değildir; kurumunuzun kapsamı ve risk sınıfı için uzman görüşü alın.
Pratik çıkarım: Regülasyon baskısı olsun veya olmasın, izlenebilirlik, dataset dokümantasyonu, kalite ölçümleri ve etiketleme süreç kayıtları; hem denetim hem de mühendislik açısından geri dönüşü yüksek yatırımlardır.
“Veri kalitesi”, “etiketleme” ve “veri yönetişimi” tek tek kavramlar değil; birlikte bir kalite yönetim sistemi oluştururlar. DAMA ve akademik çerçeveler, kalite boyutlarının çok boyutlu doğasına işaret ederken; ISO 8000-210:2024 gibi standartlar sensör verisi gibi alanlarda daha spesifik kalite karakteristikleri için ortak dil sunabilir. NIST RDaF ise yaşam döngüsü ve yönetişim perspektifini yapılandırmaya yardımcı olur. Etiketleme tarafında çok katmanlı kalite kontrol (gold/sentinel, çoklu etiketleme, adjudication ve otomatik ön kontroller) sürdürülebilirliği artırır.
Bu rehberdeki şablonlarla başlayıp kendi alanınıza göre terimleri netleştirirseniz, ekip içinde ortak dil kurar; veri hattınızı daha izlenebilir hale getirir ve modellerinizin performansını “veri üzerinden” sistematik şekilde iyileştirmek için sağlam bir temel atarsınız.
Yorumlar