Nesne Tanıma Algoritmaları Hakkında Bilinmesi Gerekenler

Fahri Gün 03 Tem 2024 Teknoloji 74  0

İçeriğimizde nesne tanıma algoritmalarına ilişkin olarak bilinmesi gereken temel hususlara yer veriyor, R-CNN, Fast R-CNN ve Faster R-CNN terimlerine değiniyoruz.

CNN algoritmaları, görüntü sınıflandırılması, nesne tespiti, yüz tanıma gibi pek çok alanda kullanılabilmektedir. Fakat mükemmel algoritmanın da bazı zaafları bulunmaktadır. Örneğin aynı anda sadece bir objenin tespit edilebilmesi bunlardan biridir. R-CNN mimarisi, görüntülerde bulunan objelere ait sınıfları ve bu objelere ait bounding box’ları (sınırlayıcı kutular) tespit etmek için kullanılmaktadır.

Çoklu objeye yönelik görsellerde kolay bir şekilde CNN çalıştırılamadığından R-CNN mimarisi geliştirilmiş olup, ana fikir iki adımdan oluşturularak ortaya çıkarılır. İlk olarak selective search ile görsel içerisinde obje olmaya aday featurelar tespit edilmektedir. Yaklaşık 2000 region belirlenmesinden sonra her biri ayrı bir biçimde CNN modeline indirilmektedir ve bounding boxları ile sınıfları hususunda tahmin yürütülür.

Yaygın olarak kullanılan metotlardan biri Selective Search olup, görsellerde yakalanması gereken kısımları tespit edebilmek amacıyla kullanılmaktadır. İlk olarak ufak bölgelerin belirlenmesi ve sonra benzer iki bölgenin birleştirilerek daha büyük yeni bölgenin ortaya çıkarılmasını meydana getirir ve şu işlem tekrarlı bir şekilde devam eder.

Intersection Over Union ise Bounding Boxlar için doğruluk değeridir. Verilmekte olan bounding box’ın gerçek bounding box ile karşılaştırması yapılmakta ve böylece IoU değeri ortaya çıkmaktadır. Söz konusu değer matematiksel olarak IoU = (y ∩ y̅) / (y U y̅) şeklinde karşımıza çıkmaktadır. IoU = Tahmin edilen alan ve gerçek alanın kesişimi / Tahmin edilen alan ve gerçek alanın birleşimini ifade eder. Bu modelde 2000 farklı aday bölge çıkarılması ile 2000 bölgeye yönelik CNN ağı kullanılması eğitimi olarak büyük bir maliyet söz konusu olmaktadır. Bu nedenle Fast R-CNN mimarileri 2000 CNN modelinden kurtularak yalnızca tek bir model kullanır. Fast R-CNN’de odaklanılması gereken en büyük geliştirme ise R-CNN’de kullanılan CNN, SVM ve Regressor’u kombinlemesi ile ortaya çıkmaktadır.

Doğal Dil İşleme Hakkında Bilgiler
Teknolojide Origami
Grafen Hakkında Bilmeniz Gerekenler
Türksat 6a’nın Fırlatılmasına Saatler Kaldı!

Yorum Yapmayı Unutmayın :)