[{"data":1,"prerenderedAt":-1},["ShallowReactive",2],{"blog-post-veri-hazirlama-ve-ozellik-muhendisligi-adimlar-terimler-ve-en-iyi-uygulamalar":3},{"dataItem":4,"heading":36,"metaData":38,"schema":81},["Reactive",5],{"id":6,"title":7,"summary":8,"content":9,"seo_title":10,"seo_description":11,"seo_keywords":12,"slug":13,"createdAt":14,"updatedAt":14,"blog_categories":15,"authors":19,"image":24,"thumb":25,"image_webp":26,"thumb_webp":27,"rating":28,"heading_title":7,"heading_sub_title":17,"readingTime":29,"url":34,"comments":35,"meta_cover":24},29440,"Veri hazırlama ve özellik mühendisliği: Adımlar, terimler ve en iyi uygulamalar","Bu rehber, Yapay Zekâ ve Veri Bilimi projelerinde veri hazırlama ve özellik mühendisliğinin temel adımlarını, sık kullanılan terimleri ve uygulanabilir en iyi uygulamaları pratik örnekler ve kontrol listeleriyle açıklar.","\u003Ch2>Giriş\u003C/h2>\n\u003Cp>Veri hazırlama ve özellik mühendisliği, Yapay Zekâ ve Veri Bilimi projelerinin performansını doğrudan etkileyen iki temel aşamadır. Ham verinin temizlenmesi, uygun biçime dönüştürülmesi ve model için anlamlı özelliklerin oluşturulması; model başarısını, genellenebilirliği ve üretime geçiş sürecini belirler. Resmi dokümanlar ve uygulama rehberleri bu iki alanın proje başarısı için kritik olduğunu vurgular \u003Ca href=\"https://developers.google.com/machine-learning/clustering/prepare-data?hl=tr\">(Google)\u003C/a> ve \u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/preprocessing-steps.htm\">(Qlik)\u003C/a>.\u003C/p>\n\n\u003Ch2>Temel kavramlar\u003C/h2>\n\u003Cp>\u003Cstrong>Veri hazırlama\u003C/strong> (data preparation): Ham verinin incelenmesi, temizlenmesi, eksik değerlerin ele alınması, aykırı değerlerin işlenmesi ve model için uygun formata dönüştürülmesini kapsar. Bu aşama, modelin anlamlı öğrenme yapabilmesi için gereklidir \u003Ca href=\"https://developers.google.com/machine-learning/clustering/prepare-data?hl=tr\">(Google)\u003C/a>.\u003C/p>\n\u003Cp>\u003Cstrong>Özellik mühendisliği\u003C/strong> (feature engineering): Ham veya işlenmiş veriden modelin performansını artıracak yeni değişkenler (özellikler) oluşturma sürecidir. Bu, doğrudan modellere beslenen veri temsilini iyileştirir ve çoğu zaman model başarısında en büyük etkiye sahiptir \u003Ca href=\"https://bilisimportal.com/konular/ozellik-muhendisligi.html\">(Bilişim Portalı)\u003C/a>.\u003C/p>\n\n\u003Ch2>Veri hazırlama: Adım adım\u003C/h2>\n\u003Col>\n  \u003Cli>\u003Cstrong>Veriyi anlamak (profiling)\u003C/strong>\n    \u003Cp>İlk adım veri tiplerini, eksik değer oranlarını, benzersiz değer sayısını ve dağılımları analiz etmektir. Hızlı özet istatistikleri (median, percentil, null sayıları) çıkarın ve görselleştirmelerle dağılımları kontrol edin.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Eksik değer stratejileri\u003C/strong>\n    \u003Cp>Kullanılabilecek yöntemler: satırı/kolonu düşürme, ortalama/medyan/mod ile doldurma, model tabanlı (KNN veya regresyonla) imputasyon, eksik/var mı gösteren bir gösterge sütunu ekleme. Hangi yöntemin uygun olduğu veri setine ve modele bağlıdır; her yöntemin avantaj ve dezavantajlarını değerlendirin.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Aykırı değerlerin (outlier) tespiti ve işlenmesi\u003C/strong>\n    \u003Cp>IQR (interquartile range), z-score veya görsel yöntemlerle aykırıları tespit edin. Davranışa göre aykırıyı kırpma (clipping), dönüştürme (log), izleme veya silme seçeneklerini değerlendirin.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Kopyalar (duplicates) ve tutarlılık\u003C/strong>\n    \u003Cp>Tekrarlayan kayıtları tespit edip kaldırın; farklı kaynaklardan gelen verilerin ortak anahtarlarla uyumlu olduğundan emin olun.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Doğru veri tipleri ve tarih saat işleme\u003C/strong>\n    \u003Cp>Tarih/saat alanlarını datetime tipine çevirin; saat dilimi (timezone) ve tarih biçimlerini standardize edin. Tarih verilerinden yıl/ay/gün, hafta içi/hafta sonu, tatil bilgisi gibi yeni değişkenler çıkarabilirsiniz.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Kategorik değişkenlerin ele alınması\u003C/strong>\n    \u003Cp>One-hot encoding, ordinal encoding, frequency encoding veya target encoding seçenekleri arasında seçim yaparken model tipini, değişkenin kardinalitesini ve overfitting riskini göz önünde bulundurun.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Ölçeklendirme (scaling)\u003C/strong>\n    \u003Cp>Distance tabanlı algoritmalar için (ör. K-means, KNN) özellikleri standardize veya normalize etmek önemlidir. Bazı algoritmalar (ağaç tabanlılar) ölçek duyarlı değildir; buna göre karar verin \u003Ca href=\"https://developers.google.com/machine-learning/clustering/prepare-data?hl=tr\">(Google)\u003C/a>.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Veri bölme ve sızıntı kontrolü\u003C/strong>\n    \u003Cp>Model değerlendirme ve gerçekçi performans için eğitim-doğrulama-test setlerini dikkatle ayırın. Zaman serisi verilerde zaman sıralamasına dikkat edin; rastgele bölme zaman sızıntısına yol açabilir.\u003C/p>\n  \u003C/li>\n  \u003Cli>\u003Cstrong>Dönüştürme adımlarını otomatikleştirin\u003C/strong>\n    \u003Cp>Özellikle üretime geçişte aynı dönüşümlerin train ve test/servis ortamında tutarlı uygulanması için pipeline veya transformers kullanın.\u003C/p>\n  \u003C/li>\n\u003C/ol>\n\n\u003Ch3>Kısa kontrol listesi (veri hazırlama)\u003C/h3>\n\u003Cul>\n  \u003Cli>Null oranlarını ve dağılımları incele\u003C/li>\n  \u003Cli>Aykırı değerleri tespit et ve uygun stratejiyi seç\u003C/li>\n  \u003Cli>Kategorik değişkenler için encoding planı hazırla\u003C/li>\n  \u003Cli>Tarih/saat alanlarını parse et ve zaman tabanlı özellikler çıkar\u003C/li>\n  \u003Cli>Train/test dönüşümlerinin aynı olduğundan emin ol\u003C/li>\n\u003C/ul>\n\n\u003Ch2>Özellik mühendisliği: Teknikler ve örnekler\u003C/h2>\n\u003Cp>Özellik mühendisliği, veriden yeni sinyaller çıkarma sanatıdır. Başlıca teknikler şunlardır:\u003C/p>\n\u003Cul>\n  \u003Cli>\u003Cstrong>Matematiksel dönüşümler:\u003C/strong> log, sqrt, reciprocal gibi dönüşümlerle dağılımı normalize edin.\u003C/li>\n  \u003Cli>\u003Cstrong>İnteraksiyonlar:\u003C/strong> İki veya daha fazla özelliğin çarpımı/toplamı gibi etkileşim terimleri oluşturmak modelin daha karmaşık ilişkileri öğrenmesine yardımcı olabilir.\u003C/li>\n  \u003Cli>\u003Cstrong>Binning (kümelendirme):\u003C/strong> Sürekli değişkenleri kategorilere bölerek nonlinear ilişkileri yakalayabilirsiniz.\u003C/li>\n  \u003Cli>\u003Cstrong>Gruplama/aggregasyon:\u003C/strong> Kullanıcı-ürün, müşteri-seans gibi gruplar için ortalama, toplam, son değer, standart sapma gibi özet özellikler oluşturun.\u003C/li>\n  \u003Cli>\u003Cstrong>Zaman serisi özellikleri:\u003C/strong> Lag, hareketli ortalama, trend veya sezonluk göstergeler.\u003C/li>\n  \u003Cli>\u003Cstrong>Metin ve kategorik veriler:\u003C/strong> TF-IDF, sayısallaştırma, embedding benzeri yaklaşımlar; yüksek kardinaliteli kategoriler için frekans veya hedef bazlı encoding.\u003C/li>\n\u003C/ul>\n\u003Cp>Örnek: E-ticaret sepet verisinde 'fiyat' ve 'indirim' sütunlarından \u003Cstrong>indirim_orani = indirim / fiyat\u003C/strong> gibi bir özellik oluşturmak, modelin fiyat ve indirim ilişkisini doğrudan kullanmasını sağlar.\u003C/p>\n\n\u003Ch2>Özellik seçimi\u003C/h2>\n\u003Cp>Çok sayıda özellik performansı artırabileceği gibi model karmaşıklığını ve aşırı öğrenmeyi (overfitting) de tetikleyebilir. Yaygın yöntemler:\u003C/p>\n\u003Cul>\n  \u003Cli>Filtre yöntemleri: korelasyon, varyans eşiği, istatistiksel testler.\u003C/li>\n  \u003Cli>Sargı (wrapper) yöntemleri: recursive feature elimination (RFE) gibi model tabanlı seçimler.\u003C/li>\n  \u003Cli>Embedded yöntemler: L1 (Lasso) gibi düzenleme teknikleri veya ağaç tabanlı modellerin feature importance değerleri.\u003C/li>\n  \u003Cli>Permutation importance: modelin performansını özellik silindiğinde ölçerek önem değerlendirmesi.\u003C/li>\n\u003C/ul>\n\u003Cp>Hangi yöntemin uygun olduğu probleme, veri boyutuna ve modele bağlıdır; genelde birkaç yöntemi karşılaştırmak faydalıdır.\u003C/p>\n\n\u003Ch2>Otomatik özellik mühendisliği ve araçlar\u003C/h2>\n\u003Cp>Otomatikleştirme, tekrar eden dönüşümleri hızlandırır ve prototip geliştirme süresini kısaltır. Platformlar, otomatik preprocessing ve feature engineering adımları sağlayabilir; örneğin Qlik AutoML özellik üretimi ve ön işleme adımlarını belgelendirir ve bazı dönüşümlerin otomatik uygulanmasını destekler \u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/automatic-feature-engineering.htm\">(Qlik AutoML)\u003C/a> ve \u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/preprocessing-steps.htm\">(Qlik preprocessing)\u003C/a>. Otomatik yaklaşımlar hızlı sonuç verir, fakat domain bilgisinin ve doğrulamanın yerini tamamen alamaz; elde edilen özelliklerin anlamlılığını ve model üzerindeki etkisini her zaman değerlendirin.\u003C/p>\n\n\u003Ch2>Üretime geçirme ve sürdürme\u003C/h2>\n\u003Cul>\n  \u003Cli>\u003Cstrong>Pipeline'ları kaydedin:\u003C/strong> Eğitimde kullanılan tüm dönüşümleri seri hale getirin ve üretimde aynı pipeline'ı kullanın.\u003C/li>\n  \u003Cli>\u003Cstrong>Özellik deposu (feature store):\u003C/strong> Yinelemeyi ve paylaşımı kolaylaştırmak için ortak feature store kullanın.\u003C/li>\n  \u003Cli>\u003Cstrong>Versiyon kontrolü:\u003C/strong> Veri, pipeline ve model değişikliklerini izleyin.\u003C/li>\n  \u003Cli>\u003Cstrong>İzleme:\u003C/strong> Model performansı, veri dağılımı değişiklikleri ve özellikların drift'ini takip edin.\u003C/li>\n\u003C/ul>\n\n\u003Ch2>Yaygın hatalar ve nasıl önlenir\u003C/h2>\n\u003Cul>\n  \u003Cli>Hedef sızıntısı: Eğitim sırasında hedef bilgisinin dolaylı yollarla özelliklere karıştığından emin olun.\u003C/li>\n  \u003Cli>Tutarsız dönüşümler: Train ve test/production verilerine farklı dönüşümler uygulamak.\u003C/li>\n  \u003Cli>Yüksek kardinaliteli kategorilere uygunsuz one-hot kullanımı (çok geniş veri matrisi oluşması).\u003C/li>\n  \u003Cli>Otomasyonun kör kullanımı: otomatik araçların ürettiği tüm özellikleri sorgulamadan kabul etmek.\u003C/li>\n\u003C/ul>\n\n\u003Ch2>Pratik örnek: Basit bir pipeline (adım adım)\u003C/h2>\n\u003Col>\n  \u003Cli>Keşif: Null oranları, veri tipleri, dağılımlar (%null, benzersiz değer sayısı).\u003C/li>\n  \u003Cli>Temizleme: Duplicates silme, tarihleri parse etme, küçük hataları düzeltme.\u003C/li>\n  \u003Cli>İmputasyon: Nicel değişkenlerde medyan, kategoriklerde en sık değer veya özel kategori.\u003C/li>\n  \u003Cli>Özellik üretimi: Tarihten gün/ay/hafta, fiyat üzerinden indirim oranı, kullanıcı başına ortalama işlem sayısı.\u003C/li>\n  \u003Cli>Encoding ve ölçeklendirme: Model tipine göre seçim yapın (ör. tree modeller için genelde ölçek gerekmez).\u003C/li>\n  \u003Cli>Özellik seçimi ve doğrulama: Çapraz doğrulama ile performans kontrolü.\u003C/li>\n  \u003Cli>Serileştirme: Pipeline ve feature listelerini kaydedin, üretimde aynı adımları uygulayın.\u003C/li>\n\u003C/ol>\n\n\u003Ch2>Sonuç\u003C/h2>\n\u003Cp>Veri hazırlama ve özellik mühendisliği, Yapay Zekâ ve Veri Bilimi projelerinde en yüksek getiriyi sağlayan çalışmalardandır. Sistematik bir yaklaşım, açık dönüşüm kayıtları ve sürekli doğrulama ile hem model performansını hem de üretim güvenilirliğini artırabilirsiniz. Resmi rehberler ve üretim araçlarının dokümantasyonları başlangıç ve uygulama için yol göstericidir \u003Ca href=\"https://developers.google.com/machine-learning/clustering/prepare-data?hl=tr\">(Google)\u003C/a>, \u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/automatic-feature-engineering.htm\">(Qlik AutoML)\u003C/a> ve \u003Ca href=\"https://bilisimportal.com/konular/ozellik-muhendisligi.html\">(Bilişim Portalı)\u003C/a>.\u003C/p>\n\n\u003Ch3>Kaynaklar\u003C/h3>\n\u003Cul>\n  \u003Cli>\u003Ca href=\"https://developers.google.com/machine-learning/clustering/prepare-data?hl=tr\">Veri hazırlama | Machine Learning | Google for Developers\u003C/a>\u003C/li>\n  \u003Cli>\u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/automatic-feature-engineering.htm\">Otomatik özellik mühendisliği | Qlik Cloud Yardımı\u003C/a>\u003C/li>\n  \u003Cli>\u003Ca href=\"https://help.qlik.com/tr-TR/cloud-services/Subsystems/Hub/Content/Sense_Hub/AutoML/preprocessing-steps.htm\">Otomatik veri hazırlama ve dönüştürme | Qlik Cloud Yardımı\u003C/a>\u003C/li>\n  \u003Cli>\u003Ca href=\"https://bilisimportal.com/konular/ozellik-muhendisligi.html\">Özellik Mühendisliği | Bilişim Portalı\u003C/a>\u003C/li>\n\u003C/ul>","Veri Hazırlama ve Özellik Mühendisliği — Adımlar ve En İyi U","Yapay Zekâ ve Veri Bilimi projeleri için veri hazırlama ve özellik mühendisliğinin adımlarını, terimleri ve pratik en iyi uygulamaları örneklerle ve kontrollist","Yapay Zekâ ve Veri Bilimi, özellik mühendisliği nedir, veri temizleme adımları, feature engineering örnekleri, data preparation, feature engineering","veri-hazirlama-ve-ozellik-muhendisligi-adimlar-terimler-ve-en-iyi-uygulamalar","2026-04-20T19:11:32.000Z",{"id":16,"title":17,"slug":18},638,"Yapay Zekâ ve Veri Bilimi","yapay-zek-ve-veri-bilimi",{"id":20,"name":21,"nickname":22,"slug":23},161,"Serkan Korkut","TechSage","serkan-korkut","/media/blog/eb962ec3ba7f0377e254e6d83d5612de.jpg","/media/blog/eb962ec3ba7f0377e254e6d83d5612de_thumb.jpg","/media/blog/eb962ec3ba7f0377e254e6d83d5612de.webp","/media/blog/eb962ec3ba7f0377e254e6d83d5612de_thumb.webp",null,{"minutes":30,"wordCount":31,"imageCount":32,"formatted":33},5,964,0,"5 dk okuma süresi","/blog/yapay-zek-ve-veri-bilimi/veri-hazirlama-ve-ozellik-muhendisligi-adimlar-terimler-ve-en-iyi-uygulamalar",[],["Reactive",37],{"title":7,"subTitle":17,"image":24},["Reactive",39],{"title":10,"meta":40,"link":75},[41,43,45,48,51,54,57,60,63,66,69,71,73],{"hid":42,"name":42,"content":11},"description",{"hid":44,"name":44,"content":12},"keywords",{"hid":46,"name":46,"content":47},"author","Ai Terimler",{"hid":49,"name":49,"content":50},"robots","index, follow, max-snippet:-1, max-image-preview:large, max-video-preview:-1",{"hid":52,"property":52,"content":53},"og:type","website",{"hid":55,"property":55,"content":56},"og:title","Ai Terimler - Blog Yazarları İçin Güncel Yapay Zeka Terimleri",{"hid":58,"property":58,"content":59},"og:description","Ai Terimler, blog yazarları ve sosyal medya içericileri için güncel yapay zeka terimleri ve açıklamalar sunan rehber bilgi blogudur.",{"hid":61,"property":61,"content":62},"og:image","https://aisozluk.net/media/blog/eb962ec3ba7f0377e254e6d83d5612de.jpg",{"hid":64,"property":64,"content":65},"og:url","https://aisozluk.net/blog/yapay-zek-ve-veri-bilimi/veri-hazirlama-ve-ozellik-muhendisligi-adimlar-terimler-ve-en-iyi-uygulamalar",{"hid":67,"name":67,"content":68},"twitter:card","summary_large_image",{"hid":70,"name":70,"content":56},"twitter:title",{"hid":72,"name":72,"content":59},"twitter:description",{"hid":74,"name":74,"content":62},"twitter:image",[76,78],{"rel":77,"href":65},"canonical",{"rel":79,"href":80},"amphtml","https://amp.aisozluk.net/blog/yapay-zek-ve-veri-bilimi/veri-hazirlama-ve-ozellik-muhendisligi-adimlar-terimler-ve-en-iyi-uygulamalar",["Reactive",82],{"@context":83,"@graph":84},"https://schema.org",[85,98],{"@type":86,"headline":10,"image":62,"author":87,"publisher":90,"datePublished":14,"dateModified":14,"mainEntityOfPage":96,"description":11},"BlogPosting",{"@type":88,"name":21,"url":89},"Person","https://aisozluk.net/yazarlar/serkan-korkut",{"@type":91,"name":47,"logo":92},"Organization",{"@type":93,"url":94,"width":95,"height":95},"ImageObject","https://aisozluk.net/img/icons/favicon.png",32,{"@type":97,"@id":65},"WebPage",{"@type":99,"itemListElement":100},"BreadcrumbList",[101,106,110,113],{"@type":102,"position":103,"name":104,"item":105},"ListItem",1,"Ana Sayfa","https://aisozluk.net",{"@type":102,"position":107,"name":108,"item":109},2,"Blog","https://aisozluk.net/blog",{"@type":102,"position":111,"name":17,"item":112},3,"https://aisozluk.net/blog/yapay-zek-ve-veri-bilimi",{"@type":102,"position":114,"name":7,"item":65},4]