Makine Öğrenimi Nedir? Temelleri, Türleri ve Gerçek Hayattan Örnekler

Makine öğrenimi (ML), yapay zekânın veriden öğrenmesini sağlayan alt dalıdır. Bu yazıda ML’in temel kavramlarını, başlıca öğrenme türlerini, değerlendirme metriklerini ve gerçek hayattan örnekleri özetliyoruz.

Etiketler: Yapay Zekâ, Makine Öğrenimi, Veri Bilimi

İçindekiler

Makine Öğrenimi Nedir?
Temel Kavramlar
Öğrenme Türleri
Değerlendirme Metrikleri
Basit ML Pipeline
Gerçek Hayattan Örnekler
Sık Sorulan Sorular
Sonuç

Makine Öğrenimi Nedir?

Makine öğrenimi; veriye dayalı olarak örüntüleri bulup tahmin/karar üretebilen modeller geliştirme bilimidir. ML = Veri + Algoritma + Model + Değerlendirme denkliğinde, amaç genelleme yapabilen bir hipotez bulmaktır.

Temel Kavramlar

Özellik (Feature): Girdiyi temsil eden sayısal/sınıfsal nitelikler.
Etiket (Label/Target): Tahmin edilmek istenen çıktı.
Eğitim/Doğrulama/Test Ayrımı: Genelleme ölçmek için veri bölünür.
Aşırı Uydurma (Overfitting): Eğitim verisini ezberleyip genelleme yapamama.
Eksik Uydurma (Underfitting): Modelin kapasitesi yetersiz kaldığında düşük performans.

Öğrenme Türleri

Denetimli Öğrenme: Etiketli veri ile sınıflandırma (ör. spam/ham) ve regresyon (ör. fiyat tahmini).
Denetimsiz Öğrenme: Etiketsiz veriyle kümeleme (ör. müşteri segmentasyonu), boyut indirgeme.
Pekiştirmeli Öğrenme: Ajan, ödül/ceza sinyaliyle politika öğrenir (oyunlar, robotik).

Değerlendirme Metrikleri

Problem	Yaygın Metrikler
Sınıflandırma	Doğruluk, Kesinlik (Precision), Duyarlılık (Recall), F1, ROC-AUC
Regresyon	MAE, MSE, RMSE, R²
Kümeleme	Silhouette, Davies–Bouldin, Calinski–Harabasz

Basit ML Pipeline

Problemi Tanımla: Amaç sınıflandırma mı, regresyon mu?
Veriyi Hazırla: Temizleme, eksik değer, aykırı değer, ölçekleme.
Model Seç: Lojistik regresyon, karar ağaçları, SVM, rastgele orman, XGBoost vb.
Doğrulama: K-Fold, erken durdurma, hiperparametre araması.
Değerlendir & İzle: Metrikler, hata analizi, model izleme (drift).

# Basit bir scikit-learn akışı (sözde kod)
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.pipeline import Pipeline

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, stratify=y)
clf = Pipeline([
    ("scaler", StandardScaler()),
    ("lr", LogisticRegression(max_iter=1000))
])
clf.fit(X_train, y_train)
print(clf.score(X_test, y_test))

Gerçek Hayattan Örnekler

İçerik Önerisi: Video/ürün öneri sistemleri (benzerlik + sıralama modelleri).
Sahtecilik Tespiti: Anomali algılama + denetimli sınıflandırma.
Metin Analizi: Duygu analizi, konu modelleme, niyet sınıflandırma.
Görüntü Tanıma: Hatalı ürün tespiti, kalite kontrol, tıbbi görüntüler.

Sık Sorulan Sorular

ML ile DL farkı nedir?

Derin öğrenme (DL), sinir ağlarının çok katmanlı varyantlarıdır. ML daha geniş; DL, ML’in bir alt kümesidir.

Ne kadar veri gerekir?

Probleme bağlıdır; basit modeller az veriyle çalışabilirken DL genelde çok daha fazla veriye ihtiyaç duyar.

En iyi algoritma hangisi?

Tek bir “en iyi” yoktur. Veri dağılımı, özellikler ve hedef metrik belirleyicidir; denenerek bulunur.

Sonuç

Makine öğrenimi; doğru veri, sağlam doğrulama ve etik ilkelerle birleştiğinde sürdürülebilir değer üretir. Küçük bir pilotla başlayıp ölçerek büyütmek en sağlıklı yaklaşımdır.

İlk yazı: Yapay Zekâ — Giriş · Devamı: Denetimli Öğrenme Nedir?