Makine öğrenimi (ML), yapay zekânın veriden öğrenmesini sağlayan alt dalıdır. Bu yazıda ML’in temel kavramlarını, başlıca öğrenme türlerini, değerlendirme metriklerini ve gerçek hayattan örnekleri özetliyoruz.
Etiketler: Yapay Zekâ, Makine Öğrenimi, Veri Bilimi
Makine Öğrenimi Nedir?
Makine öğrenimi; veriye dayalı olarak örüntüleri bulup tahmin/karar üretebilen modeller geliştirme bilimidir. ML = Veri + Algoritma + Model + Değerlendirme denkliğinde, amaç genelleme yapabilen bir hipotez bulmaktır.
Temel Kavramlar
- Özellik (Feature): Girdiyi temsil eden sayısal/sınıfsal nitelikler.
- Etiket (Label/Target): Tahmin edilmek istenen çıktı.
- Eğitim/Doğrulama/Test Ayrımı: Genelleme ölçmek için veri bölünür.
- Aşırı Uydurma (Overfitting): Eğitim verisini ezberleyip genelleme yapamama.
- Eksik Uydurma (Underfitting): Modelin kapasitesi yetersiz kaldığında düşük performans.
Öğrenme Türleri
- Denetimli Öğrenme: Etiketli veri ile sınıflandırma (ör. spam/ham) ve regresyon (ör. fiyat tahmini).
- Denetimsiz Öğrenme: Etiketsiz veriyle kümeleme (ör. müşteri segmentasyonu), boyut indirgeme.
- Pekiştirmeli Öğrenme: Ajan, ödül/ceza sinyaliyle politika öğrenir (oyunlar, robotik).
Değerlendirme Metrikleri
Problem | Yaygın Metrikler |
---|---|
Sınıflandırma | Doğruluk, Kesinlik (Precision), Duyarlılık (Recall), F1, ROC-AUC |
Regresyon | MAE, MSE, RMSE, R² |
Kümeleme | Silhouette, Davies–Bouldin, Calinski–Harabasz |
Basit ML Pipeline
- Problemi Tanımla: Amaç sınıflandırma mı, regresyon mu?
- Veriyi Hazırla: Temizleme, eksik değer, aykırı değer, ölçekleme.
- Model Seç: Lojistik regresyon, karar ağaçları, SVM, rastgele orman, XGBoost vb.
- Doğrulama: K-Fold, erken durdurma, hiperparametre araması.
- Değerlendir & İzle: Metrikler, hata analizi, model izleme (drift).
# Basit bir scikit-learn akışı (sözde kod)
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)
clf = Pipeline([
("scaler", StandardScaler()),
("lr", LogisticRegression(max_iter=1000))
])
clf.fit(X_train, y_train)
print(clf.score(X_test, y_test))
Gerçek Hayattan Örnekler
- İçerik Önerisi: Video/ürün öneri sistemleri (benzerlik + sıralama modelleri).
- Sahtecilik Tespiti: Anomali algılama + denetimli sınıflandırma.
- Metin Analizi: Duygu analizi, konu modelleme, niyet sınıflandırma.
- Görüntü Tanıma: Hatalı ürün tespiti, kalite kontrol, tıbbi görüntüler.
Sık Sorulan Sorular
ML ile DL farkı nedir?
Derin öğrenme (DL), sinir ağlarının çok katmanlı varyantlarıdır. ML daha geniş; DL, ML’in bir alt kümesidir.
Ne kadar veri gerekir?
Probleme bağlıdır; basit modeller az veriyle çalışabilirken DL genelde çok daha fazla veriye ihtiyaç duyar.
En iyi algoritma hangisi?
Tek bir “en iyi” yoktur. Veri dağılımı, özellikler ve hedef metrik belirleyicidir; denenerek bulunur.
Sonuç
Makine öğrenimi; doğru veri, sağlam doğrulama ve etik ilkelerle birleştiğinde sürdürülebilir değer üretir. Küçük bir pilotla başlayıp ölçerek büyütmek en sağlıklı yaklaşımdır.
İlk yazı: Yapay Zekâ — Giriş · Devamı: Denetimli Öğrenme Nedir?