Görüntü Tanıma Nedir?

Ana Sayfa » Görüntü Tanıma » Görüntü Tanıma Nedir?

Görüntü Tanıma Nedir?

Görüntü tanıma, bilgisayar kontrolündeki makinelerin görmelerini sağlayan teknolojidir.

Resimlerden ve videolardan bilgi çıkarmak için gerekli teorileri araştıran bilim dalıdır. Makinelerin, insan gibi, gördükleri görüntüler üzerinden yorum yapmasını ve karar vermesini sağlar. Görerek karar vermeyi gerektiren durumlarda insansız olarak hızlı karar verilmesinin yolunu açar.

Bilimsel bir disiplin olarak, görüntülerden bilgi elde etmek için üretilen yapay sistemlerin teori ve teknolojileri ile ilgilenir. Teknolojik olarak, görüntü tanıma ilgili teori ve modelleri görüntü tanıma sistemleri üretmek üzerine odaklanır.

Örnek olarak gösterilebilecek bazı görüntü tanıma sistemleri içinde aşağıdakiler sayılabilir. Bu örnekleri çoğaltmak mümkündür.

  1. Kontrol prosesleri (Endüstriyel robotlar, otonom araçlar),
  2. Yakalama (Görsel güvenlik ve izleme),
  3. Bilgi düzenleme (Resim ve video veri tabanları üzerinde yapılan işlemler),
  4. Nesne ve çevre modelleme (Endüstriyel inceleme, tıbbi resim analizi, topolojik modelleme)
  5. Interaktivite (Makine-İnsan iletişimi için veri toplanması)

Görüntü tanıma biyolojik görmenin (canlı göz) tersi olarak değil, aksine tamamlayıcısı olarak tanımlanabilir. Biyolojik görme üzerine hayvanların ve insanların görsel algıları incelenmiştir ve bu biyolojik sistemlerin nasıl çalıştıkları psikolojik prosesler şeklinde modellenmiştir. Öte yandan görüntü tanıma ise yazılım ve donanım ile işletilen yapay sistemler üzerine odaklanmıştır.

Görüntü Tanıma Sizin İçin Ne Yapabilir?

Görüntü tanıma teknolojisinden nasıl yararlanacağınızı aşağıdaki basit soruları kendinize sorarak anlayabilirsiniz.

Bir şeye bakarak görmeniz gerekiyor mu?

Bir şeye bakarak okumanız, ayırmanız veya kontrol etmeniz gerekiyor mu? İşiniz bir şeyin insan gözüyle görülmesini gerektiriyor mu?

Örneğin:

  • Bir yazı okumanız gerekiyor olabilir.
    Bu bir otomobil plakası, bir tırın konteyner üzerindeki kodu, bir ürün üzerindeki son kullanma tarihi, etikete basılmış bir yazı, nüfus cüzdanı/pasaport bilgileri olabilir. Ya da başka herhangi bir yerdeki herhangi bir yazı olabilir.
  • Bir şekil ayırt etmeniz veya denetlemeniz gerekiyor olabilir.
    Bir ürünün şekilleri, desenleri, herhangi bir simge, işaret olabilir.
  • Bir şeyin kalitesini gözünüzle izlemeniz gerekiyor olabilir.
    Üründe çizik, dökük, çatlak var mı?

İnsan gözüyle ayırt etmesi zor olan veya insanın yapamayacağı hızlarda görme gerektiren bir işiniz var mı?

  • Ekranda büyük görüntüsü olsa insan tarafından yapılabilecek bir iş mi?
  • Çok hızlı olan ama yavaş olsa bir insanın gözüyle incelenebilecek bir iş mi?
  • Ya da bakılarak yapılan bir işi hızlandırmak mı istiyorsunuz?

Bakılan şey çok büyük bir listeden kontrol gerektiriyor mu?

Görülen şey büyük bir listeden kontrol edilip karar verilmesi gereken bir durum mu? Örneğin otoparka giriş izni olan araç plaka listesi, belirli bir ürünün şekline göre üretim bandında yönlendirilmesi gibi.

Gözleme dayalı kalite kontrol var mı?

Kalite kontrol işlemi gözlem ile yapılıyor mu? Bu süreci hızlandırmak ve insan hatasından arındırmak istiyor musunuz?

Kamera ile izlenerek karar verilebilecek bir iş var mı?

Kamera ile izlediğinizde görüntüye göre karar vereceğiniz bir uygulamanız var mı?

Bir şeyler saymanız, gruplamanız, yerini takip etmeniz gerekiyor mu?

Görüntüdeki insanları saymak, geçen araçları bulmak, reklam panosu önünden geçenleri hesaplamak gibi örnekler olabilir. Bir üretim bandından geçen ürün yoğunluğunu, adedini hesaplamak gibi endüstriyel uygulamalar da olabilir.