[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"blog-post-model-degerlendirme-metrigi-dogruluk-f1-ve-auc-arasindaki-fark":3},{"dataItem":4,"heading":36,"metaData":38,"schema":81},["Reactive",5],{"id":6,"title":7,"summary":8,"content":9,"seo_title":10,"seo_description":11,"seo_keywords":12,"slug":13,"createdAt":14,"updatedAt":14,"blog_categories":15,"authors":19,"image":24,"thumb":25,"image_webp":26,"thumb_webp":27,"rating":28,"heading_title":7,"heading_sub_title":17,"readingTime":29,"url":34,"comments":35,"meta_cover":24},33140,"Model Değerlendirme Metriği: Doğruluk, F1 ve AUC Arasındaki Fark","Bu makale, makine öğreniminde yaygın kullanılan üç performans metriğini — doğruluk (accuracy), F1 skoru ve AUC ROC — açıklar, hesaplama örnekleri ve avantaj/dezavantajlarıyla karşılaştırır ve hangi durumda hangi metriğin daha uygun olduğunu pratik bir kontrol listesi ile gösterir.","\u003Ch2>Model Değerlendirme Metriği: Doğruluk, F1 ve AUC Arasındaki Fark\u003C/h2>\n\u003Cp>Makine öğrenimi projelerinde model performansını tek bir sayı ile özetlemek cazip olsa da her metrik farklı bir soruya cevap verir. Bu rehberde \u003Cstrong>doğruluk (accuracy)\u003C/strong>, \u003Cstrong>F1 skoru\u003C/strong> ve \u003Cstrong>AUC ROC\u003C/strong> metriklerinin ne olduğunu, nasıl hesaplandıklarını, güçlü ve zayıf yönlerini ve pratikte hangi durumlarda tercih edilmesi gerektiğini adım adım ele alacağız.\u003C/p>\n\n\u003Ch3>Neden doğru metriği seçmelisiniz?\u003C/h3>\n\u003Cp>Metriğin seçimi doğrudan ürün kararlarını, hata maliyetlerini ve model optimizasyon stratejisini etkiler. Örneğin sahte işlem (fraud) tespiti gibi pozitif örneklerin az olduğu (dengesiz) görevlerde doğruluk yanıltıcı olabilir; aynı veri için F1 veya precision/recall tabanlı ölçütler daha anlamlı sonuç verir. Bu farkları anlamak, model karşılaştırma ve eşik seçimi (threshold tuning) süreçlerinde kritik önem taşır (\u003Ca href=\"https://www.datasciencebase.com/intermediate/machine-learning/evaluation-metrics/\">DataScienceBase\u003C/a>).\u003C/p>\n\n\u003Ch3>Temel tanımlar ve karışıklık matrisi (confusion matrix)\u003C/h3>\n\u003Cp>Aşağıdaki 2x2 tablo, ikili sınıflandırmada temel sayıları tanımlar:\u003C/p>\n\u003Ctable>\n  \u003Cthead>\n    \u003Ctr>\n      \u003Cth>\u003C/th>\n      \u003Cth>Predicted Positive\u003C/th>\n      \u003Cth>Predicted Negative\u003C/th>\n    \u003C/tr>\n  \u003C/thead>\n  \u003Ctbody>\n    \u003Ctr>\n      \u003Cth>Actual Positive\u003C/th>\n      \u003Ctd>TP (True Positive)\u003C/td>\n      \u003Ctd>FN (False Negative)\u003C/td>\n    \u003C/tr>\n    \u003Ctr>\n      \u003Cth>Actual Negative\u003C/th>\n      \u003Ctd>FP (False Positive)\u003C/td>\n      \u003Ctd>TN (True Negative)\u003C/td>\n    \u003C/tr>\n  \u003C/tbody>\n\u003C/table>\n\u003Cp>Buradan türetilen temel formüller:\u003C/p>\n\u003Cul>\n  \u003Cli>\u003Cstrong>Doğruluk (Accuracy)\u003C/strong> = (TP + TN) / (TP + TN + FP + FN)\u003C/li>\n  \u003Cli>\u003Cstrong>Kesinlik (Precision)\u003C/strong> = TP / (TP + FP)\u003C/li>\n  \u003Cli>\u003Cstrong>Duyarlılık / Geri çağırma (Recall)\u003C/strong> = TP / (TP + FN)\u003C/li>\n  \u003Cli>\u003Cstrong>F1 skoru\u003C/strong> = 2 * (Precision * Recall) / (Precision + Recall)\u003C/li>\n  \u003Cli>\u003Cstrong>AUC ROC\u003C/strong> = ROC eğrisinin altındaki alan; ROC, True Positive Rate vs False Positive Rate çizimidir\u003C/li>\n\u003C/ul>\n\n\u003Ch3>Doğruluk (Accuracy): Avantajlar ve sınırlamalar\u003C/h3>\n\u003Cp>\u003Cstrong>Ne ölçer?\u003C/strong> Toplam doğru tahminlerin oranını ölçer. Basit ve anlaşılır bir ölçüttür.\u003C/p>\n\u003Cp>\u003Cstrong>Ne zaman uygundur?\u003C/strong> Sınıfların nispeten dengeli olduğu ve yanlış pozitif ile yanlış negatif sonuçlarının maliyetinin benzer olduğu durumlarda kullanışlıdır (\u003Ca href=\"https://www.datasciencebase.com/intermediate/machine-learning/evaluation-metrics/\">DataScienceBase\u003C/a>).\u003C/p>\n\u003Cp>\u003Cstrong>Sınırlama:\u003C/strong> Dengesiz veri kümelerinde yüksek doğruluk, modelin işe yaramadığını gizleyebilir (örneğin pozitif sınıf çok küçükse her örneği negatif tahmin eden bir model yüksek doğruluk elde edebilir).\u003C/p>\n\n\u003Ch3>Kesinlik, Duyarlılık ve F1 Skoru\u003C/h3>\n\u003Cp>\u003Cstrong>Kesinlik (Precision)\u003C/strong>, pozitif olarak tahmin edilen örneklerin ne kadarının gerçekten pozitif olduğunu söyler. \u003Cstrong>Duyarlılık (Recall)\u003C/strong> ise gerçek pozitiflerin ne kadarının tespit edildiğini gösterir.\u003C/p>\n\u003Cp>\u003Cstrong>F1 skoru\u003C/strong>, precision ve recall arasındaki dengeyi sağlar; özellikle pozitif sınıfın nadir olduğu veya hem FP hem FN maliyetlerinin önemli olduğu görevlerde (ör. spam tespiti, bazı bilgi çıkarma görevleri) tercih edilir (\u003Ca href=\"https://www.flowhunt.io/tr/sozluk/f1-score/\">FlowHunt\u003C/a>).\u003C/p>\n\n\u003Ch3>ROC Eğrisi ve AUC: Karar eşiğinden bağımsız değerlendirme\u003C/h3>\n\u003Cp>ROC eğrisi modelin farklı karar eşiklerinde (threshold) True Positive Rate ile False Positive Rate ilişkisini gösterir. \u003Cstrong>AUC\u003C/strong> (Area Under the Curve), bu eğrinin altındaki alandır ve modelin sınıfları ayırt etme gücünü özetler. AUC, eşikten bağımsız bir sıralama yeteneği ölçüsüdür; bu nedenle eşik seçimi öncesi model karşılaştırmasında sık kullanılır (\u003Ca href=\"https://docs.tealium.com/predict/evaluate-models/the-roc-auc-curve/\">Tealium\u003C/a>).\u003C/p>\n\u003Cp>Not: AUC genellikle sınıf dengesizliğine karşı daha dayanıklıdır, ancak iş maliyetleri veya belirli eşiklerdeki performans gereksinimleri göz önüne alınmadan tek başına yeterli olmayabilir.\u003C/p>\n\n\u003Chr>\n\u003Ch3>Kıyaslamalı bir örnek (pratik)\u003C/h3>\n\u003Cp>Varsayalım veri setimiz 1.000 örnek ve bu örneklerden 50 tanesi pozitif. İki sınıflandırıcıyı karşılaştıralım:\u003C/p>\n\u003Cul>\n  \u003Cli>\u003Cstrong>Çoğunluk sınıflandırıcısı\u003C/strong> (her zaman negatif tahmin eder): TP=0, FP=0, FN=50, TN=950 → Doğruluk = 95%, Recall = 0, F1 = 0.\u003C/li>\n  \u003Cli>\u003Cstrong>Model X\u003C/strong> (pozitifleri yakalayabiliyor ama çok fazla false positive de üretiyor): TP=30, FP=270, FN=20, TN=680 → Doğruluk = 71%, Precision = 10%, Recall = 60%, F1 ≈ 17%.\u003C/li>\n\u003C/ul>\n\u003Cp>Bu örnekte doğruluk açısından ilk model daha iyi gözükür (95% vs 71%), fakat pozitif sınıfı yakalama açısından ikinci model (Model X) anlamlı bir iyileşme sağlar. Eğer pozitif sınıfın yakalanması (ör. sahte işlemin tespiti) kritikse, F1 veya recall tabanlı ölçütleri tercih etmek gerekir. Bu tür karşılaştırmalar için çeşitli metrikleri aynı anda raporlamak önemlidir (\u003Ca href=\"https://metricgate.com/blogs/auc-vs-accuracy-vs-f1/\">MetricGate\u003C/a>).\u003C/p>\n\n\u003Ch3>Hangi metriği seçmelisiniz? Pratik karar akışı\u003C/h3>\n\u003Col>\n  \u003Cli>Sınıf dağılımını kontrol edin (pozitif/negatif oranı).\u003C/li>\n  \u003Cli>İş hedefinizi tanımlayın: yanlış pozitiflerin (FP) mı yoksa yanlış negatiflerin (FN) mı maliyeti daha yüksek?\u003C/li>\n  \u003Cli>Eğer sınıflar dengeli ve FP/FN maliyetleri benzer ise \u003Cstrong>doğruluk\u003C/strong> kullanılabilir.\u003C/li>\n  \u003Cli>Eğer pozitif sınıf nadirse ve hem FP hem FN önemliyse \u003Cstrong>F1 skoru\u003C/strong> veya precision/recall tabanlı ölçütler tercih edin.\u003C/li>\n  \u003Cli>Eşikten bağımsız genel ayırt etme gücünü görmek için \u003Cstrong>AUC ROC\u003C/strong> kullanın; ancak iş eşiğini seçerken precision/recall eğrilerini de kontrol edin.\u003C/li>\n  \u003Cli>Her zaman birden fazla metriği raporlayın (confusion matrix + accuracy + precision + recall + F1 + AUC) ve eşik ayarlamasını iş gereksinimlerine göre yapın.\u003C/li>\n\u003C/ol>\n\n\u003Ch3>Uygulama kontrol listesi (adım adım)\u003C/h3>\n\u003Cul>\n  \u003Cli>1) Veri dağılımını (sınıf dengesini) inceleyin.\u003C/li>\n  \u003Cli>2) Confusion matrix oluşturun ve temel oranları hesaplayın (precision, recall, accuracy).\u003C/li>\n  \u003Cli>3) AUC ve ROC eğrisini hesaplayın; PR (Precision-Recall) eğrisini de çizmek özellikle dengesiz verilerde faydalıdır.\u003C/li>\n  \u003Cli>4) Modelleri iş hedeflerine göre eşiklendirin (threshold tuning) ve maliyet fonksiyonlarını göz önünde bulundurun.\u003C/li>\n  \u003Cli>5) Karşılaştırma raporunda en az iki farklı metriği birlikte sunun.\u003C/li>\n\u003C/ul>\n\n\u003Ch3>Yaygın hatalar ve kaçınma yolları\u003C/h3>\n\u003Cul>\n  \u003Cli>Tek metrikle karar vermek: Birden fazla metrik raporlamak daha güvenlidir.\u003C/li>\n  \u003Cli>Sınıf dengesizliğini göz ardı etmek: Dengesiz veri varsa precision/recall ve PR eğrilerine bakın.\u003C/li>\n  \u003Cli>AUC’yu tek başına model kalibrasyonu veya belirli eşik performansı için kullanmak: AUC, sıralamayı ölçer; eşik-seçim sonrası performans farklı olabilir.\u003C/li>\n\u003C/ul>\n\n\u003Ch3>Önerilen raporlama formatı\u003C/h3>\n\u003Cp>Her model için aşağıdakileri raporlayın:\u003C/p>\n\u003Cul>\n  \u003Cli>Confusion matrix\u003C/li>\n  \u003Cli>Accuracy, Precision, Recall, F1\u003C/li>\n  \u003Cli>AUC ROC (ve mümkünse PR AUC)\u003C/li>\n  \u003Cli>Seçilen eşik değeri ve nedenleri\u003C/li>\n\u003C/ul>\n\n\u003Ch3>Kaynaklar ve ileri okuma\u003C/h3>\n\u003Cul>\n  \u003Cli>\u003Ca href=\"https://www.datasciencebase.com/intermediate/machine-learning/evaluation-metrics/\">Model Evaluation Metrics for Supervised Learning — DataScienceBase\u003C/a> (genel metrikler ve sınırlamalar)\u003C/li>\n  \u003Cli>\u003Ca href=\"https://www.flowhunt.io/tr/sozluk/f1-score/\">F1 Skoru — FlowHunt\u003C/a> (F1 tanımı ve kullanım alanları)\u003C/li>\n  \u003Cli>\u003Ca href=\"https://docs.tealium.com/predict/evaluate-models/the-roc-auc-curve/\">The ROC/AUC curve — Tealium\u003C/a> (ROC/AUC açıklaması)\u003C/li>\n  \u003Cli>\u003Ca href=\"https://metricgate.com/blogs/auc-vs-accuracy-vs-f1/\">AUC vs Accuracy vs F1 — MetricGate\u003C/a> (karşılaştırmalı tartışma)\u003C/li>\n\u003C/ul>\n\n\u003Ch3>Sonuç\u003C/h3>\n\u003Cp>Doğruluk, F1 skoru ve AUC ROC farklı yönlerden model performansını değerlendirir. Doğru metriği seçmek için veri dağılımınızı, iş gereksinimlerinizi ve hata maliyetlerini dikkate alın; genellikle birden fazla metriği birlikte raporlamak en güvenilir yaklaşımdır.\u003C/p>","Model Değerlendirme: Doğruluk vs F1 vs AUC — Hangi Metriği/N","Doğruluk, F1 skoru ve AUC ROC arasındaki farkları, hesaplamalarını ve hangi senaryoda hangi metriğin uygun olduğunu öğrenin. Uygulamalı kontrol listesi ve örnek","makine öğrenimi terimleri, kesinlik (precision), duyarlılık (recall), F1 skoru, AUC ROC, model performans metriği","model-degerlendirme-metrigi-dogruluk-f1-ve-auc-arasindaki-fark","2026-05-09T14:14:18.000Z",{"id":16,"title":17,"slug":18},632,"Makine Öğrenimi Terimleri","makine-ogrenimi-terimleri",{"id":20,"name":21,"nickname":22,"slug":23},160,"Elçin Yavuz","AIExplorer","elcin-yavuz","/media/blog/613862246285df57e34e73aacfdd3378.jpg","/media/blog/613862246285df57e34e73aacfdd3378_thumb.jpg","/media/blog/613862246285df57e34e73aacfdd3378.webp","/media/blog/613862246285df57e34e73aacfdd3378_thumb.webp",null,{"minutes":30,"wordCount":31,"imageCount":32,"formatted":33},5,830,0,"5 dk okuma süresi","/blog/makine-ogrenimi-terimleri/model-degerlendirme-metrigi-dogruluk-f1-ve-auc-arasindaki-fark",[],["Reactive",37],{"title":7,"subTitle":17,"image":24},["Reactive",39],{"title":10,"meta":40,"link":75},[41,43,45,48,51,54,57,60,63,66,69,71,73],{"hid":42,"name":42,"content":11},"description",{"hid":44,"name":44,"content":12},"keywords",{"hid":46,"name":46,"content":47},"author","Ai Terimler",{"hid":49,"name":49,"content":50},"robots","index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1",{"hid":52,"property":52,"content":53},"og:type","website",{"hid":55,"property":55,"content":56},"og:title","Ai Terimler - Blog Yazarları İçin Güncel Yapay Zeka Terimleri",{"hid":58,"property":58,"content":59},"og:description","Ai Terimler, blog yazarları ve sosyal medya içericileri için güncel yapay zeka terimleri ve açıklamalar sunan rehber bilgi blogudur.",{"hid":61,"property":61,"content":62},"og:image","https://aisozluk.net/media/blog/613862246285df57e34e73aacfdd3378.jpg",{"hid":64,"property":64,"content":65},"og:url","https://aisozluk.net/blog/makine-ogrenimi-terimleri/model-degerlendirme-metrigi-dogruluk-f1-ve-auc-arasindaki-fark",{"hid":67,"name":67,"content":68},"twitter:card","summary_large_image",{"hid":70,"name":70,"content":56},"twitter:title",{"hid":72,"name":72,"content":59},"twitter:description",{"hid":74,"name":74,"content":62},"twitter:image",[76,78],{"rel":77,"href":65},"canonical",{"rel":79,"href":80},"amphtml","https://amp.aisozluk.net/blog/makine-ogrenimi-terimleri/model-degerlendirme-metrigi-dogruluk-f1-ve-auc-arasindaki-fark",["Reactive",82],{"@context":83,"@graph":84},"https://schema.org",[85,98],{"@type":86,"headline":10,"image":62,"author":87,"publisher":90,"datePublished":14,"dateModified":14,"mainEntityOfPage":96,"description":11},"BlogPosting",{"@type":88,"name":21,"url":89},"Person","https://aisozluk.net/yazarlar/elcin-yavuz",{"@type":91,"name":47,"logo":92},"Organization",{"@type":93,"url":94,"width":95,"height":95},"ImageObject","https://aisozluk.net/img/icons/favicon.png",32,{"@type":97,"@id":65},"WebPage",{"@type":99,"itemListElement":100},"BreadcrumbList",[101,106,110,113],{"@type":102,"position":103,"name":104,"item":105},"ListItem",1,"Ana Sayfa","https://aisozluk.net",{"@type":102,"position":107,"name":108,"item":109},2,"Blog","https://aisozluk.net/blog",{"@type":102,"position":111,"name":17,"item":112},3,"https://aisozluk.net/blog/makine-ogrenimi-terimleri",{"@type":102,"position":114,"name":7,"item":65},4]