Uygulamamız, Başlıkdanda anlayacağınız gibi Haber Metinlerinin otomatik sınıflandırılması. Uygulamamız için gereken veriyi Kemik den aldık. Kemik Yıldız Teknik Üniversitesinin Doğal Dil İşleme Grubu. Neden Kemik? sorusunuda “Çünkü dilin kemiği yoktur” diye cevaplıyorlar.
Gurubun yayınladığı veri kümelerinden 75Haber diye geçen veri kümesini kullanacağız Veri kümesi M.Fatih Amasyalı tarafından hazırlanmış ve bu makalede Otomatik Haber Metinleri Sınıflandırma”, M.Fatih Amasyalı, Tülay Yıldırım, SIU 2004 kullanılmıştır.
5 farklı haber sınıfına ait 15’şer, toplamda 75 haber içermektedir.
Haber metinlerinin sınıfları:
- ekonomi
- magazin
- sağlık
- siyasi
- spor
KNIME ile veri okunup test ve eğitim olarak 2 ye ayrıldı ( 50 eğitim 25 test ) SVM ve Weka-Bayes ile sınıflandırma işlemi yapıldı
İşlemin akış şeması

ve Test verileri için sonuçlar şöyle
Bayes 25 yazıdan 22 sini doğru sınıflandırmış

SVM ise 25 yazıdan 13’ünü doğru sınıflandırmış

Kaynak: http://derindelimavi.blogspot.com.tr/2011/06/knime-ve-haber-metinlerinin_26.html / 2011
Birol Kuyumcu