Merhaba sevgili okuyucularım.
Yeni yazımızın konusu başlıkta gördüğünüz gibi Veri Madenciliği ingilizce tabiriyle data mining
Veri Madenciliği Nedir?
Veri Madenciliğinin bir kaç beğendiğim tanımı var.Daha yeni Dr.Yalçın Özkan'nın Veri Madenciliği Yöntemleri kitabını okurken
gördüğüm tanım şuydu:
Kurumlarda biriken veri içinden kurum için yararlı olanların bulup ortaya çıkarma işine veri madenciliği adı verilir.
Diğer tanımları da vereyim.
Çok büyük verilen arasından(big data) faydalı olana ulaşabilme bilgi madenleme işidir.Bu veriler içinde gelecekle
ilgili tahminde bulunmak için bilgisayar programlarından yararlanılan bir şeydir.
Tanımlardan sonra bu işin ne olduğunu açıklamak isterim tabi tanımlarda aslında gayet net.Yine de bende kendimce dersini almakta olduğum dersten anladıklarımı aktarayım.
Veri madenciliği hayatınızın çoğu alanında karşılaşıyorsunuz.Aldığınız kararlarda bile önemli bir faktör.Örneğin kredi almak istiyorsunuz ama size çıkacak mı çıkmayacak mı? işte bunu belirleyen
alanda veri madenciliği kullanılıyor.
Yeri gelmişken Veri madenciliği,Yapay Zeka,Makine Öğrenmesi ve istatistik çok içi içe bir alan.Birbirlerinin alt dalları ve yandalları.
Şimdi izninizle Veri/Enformasyon/Bilgi/Bilgelik kavramlarını açıklamak isterim.Derste bizim gördüğümüz ilk temek konulardandı.Bu bir piramit sırasyıla yukarıya doğru ilerliyorç
Veri : İşlenmemiş ham bilgi parçasıdır.
Enformasyon : Verinin işlenmesi,düzenlenmesi ve birbirleriyle ilişkilendirme adımı
Bilgi : Enformasyon sonucu işlenen verilerin toplanmış halidir.
Hemen konuya inemden bir Yapay Zeka tanımı yapalım.
Yapay Zeka Nedir?
Yapay Zeka,makinelerin insan zekasını taklit etmeye çalıştığı zeka türüdür.
Tabi biz makineyi eğitirken 4 çeşit yapı var:
Ben size burada en yaygın kullanılan denetimli ve denetimsiz öğrenmeyi anlatmak istiyorum.
Denetimli Öğrenme :
Şimdi makineyi eğitirken etiketli veri dediğimiz veri setleriyle eğitiyoruz.Nasıl yani derseniz ki derseniz haklısınız.Mesela üçgen resmi var ve karşında üçgen yazıyor.
yine aynı şekilde dikdörtgen resmi var ve adı yazıyor.Bu şekilde bir sürü nesne daha üretebilirsiniz.Biz ne yaptık yapay zekaya resmi ve ne olduğunu verdik yani bizim elimizdekilere göre eğittik.
Daha sonra herhangi sonradan bir nesne sorduğumuzda biliyorsa eğitim başarıldır.Şimdi biz bunu eğitirken kullandığımız veri seti ve test için ayırdığımız bir veri seti var.(Test and valudation) Eğitim verilerinden sormuyoruz ki test ederken ezberlemiş mi öğrenmiş mi ? test edebilmek için.
Eğer ezberlediyse biz buna overfitting(aşırı uyum gösterme,öğrenme) diyoruz.Test verilerini verdiğimizde başarısız olursa da underfitting (yetersiz uyum) diyoruz.
Denetimsiz Öğrenme :