Image Segmentation (Görüntü Bölütleme) Hakkında Bilinmesi Gerekenler
İçeriğimizde Image Segmentation yani görüntü bölütleme teriminin ne anlama geldiğine yer vermekte, bu hususta bilinmesi gerekenlere değinmekteyiz.
Örnekle açıklayacak olursak, günümüzde giderek daha popüler hale gelen otonom araçların nesnelerin bounding boxları tespit etmede zorluklar yaşanabildiği göz önüne alındığında araçların nesneleri kapsayan kutular yerine nesnelerin sınırlarını tespit etmesi gerekmekte ve bu bağlamda Image Segmentation yani görüntü bölütleme kullanılmaktadır.
Objelerin sınıflarının yanında bounding boxlardan ziyade sınırlarının maskelerle belirtilmesi için kullanılmaktadır. İki farklı temel bölütleme tekniği yer almakta olup bunların Semantic Segmentation ve Instance Segmatation olduğunu belirtmek gerekmektedir. Instance Segmentation’da her piksele belirli bir sınıf atanır fakat, aynı sınıftaki iki farklı nesne birbirlerinden farklı renkler kullanmaktadır.
Kullanılmakta olan görseller RGB olmak üzere üç farklı katmandan oluşmakta olan, piksel değerleri mevcut olan matrisler olarak karşımıza çıkmaktadır. Bunlar gray-scale yani siyah beyaz ve tek katmanlı hale getirildiğinde üç katmandan kurtulunmuş olunur. Tek katmanlı olan nesneler arası geçişler ve arka plandan bağımsız olan nesneler farklı piksel değerlerine sahip olmalarından ötürü threshold değer belirlenip ayrılabilir. Global Threshold, görüntüyü yalnızca nesne ve arkaplan halinde ikiye böler. Tek bir eşik belirlenir ve söz konusu değer global threshold olarak karşımıza çıkar. Bunun yanı sıra arka plandan birden fazla nesneyi ayırabilmek için tek threshold değeri yerine birden fazla threshold değeri belirlenebilmektedir ve bunlar local theshold olarak kabul edilmektedir.
Kümeleme tekniği günümüzde gözetimsiz öğrenmede yaygındır ve sınıflandırama problemleri hususunda etiketsiz veriyi belirli niteliklere göre kendi başına sınıflandırmakta olan kümeleme algoritmaları görüntü bölütlemede kullanılabilir. Bu bağlamda K-Means algoritması sık bir şekilde kullanılmaktadır. K-Means algoritması görseli girdi olarak almakta ve pikselleri elde edilmek istenen sınıf kadar gruplamaktadır. Kümeleme algoritması temelde ilk olarak rastgele küme merkezleri belirlemekte ve bölgeye yakın olan değerleri renklerle belirlemektedir. Kümelerin merkezi hesaplanır ve yeni kümeler belirlenir. İşlem iteratif olarak merkezler değişmeyinceye kadar sürer ve merkezler artık değişmediği zaman kümeler son halini almış hale gelir.