Bilgisayarlı görme

Cisimlerin görsel üzerinden otomatik olarak tanımlanmasını mümkün kılan Bilgisayarlı Görme (Computer Vision) teknolojileri, sadece bir fotoğrafla var olan hastalıkların tespitine ya da bir kaza fotoğrafından suçlu aracın hangisi olduğunu anlamaya kadar pek çok konuda insanlığa fayda sağlayabilir.

Kısaca EDS olarak bilinen Elektronik Denetim Sistemi emniyet şeridine girişi azaltmamış olsa da, emniyet şeridini kullanan ‘insansı’ların tespit edilmesinde çok işe yarıyor. Dolayısıyla bize en azından bu imkanı sağlayan teknolojiye bir saygı duruşu olarak, bu ay ‘Bilgisayarlı Görme’ konuşalım istedim.

Bilgisayarlı Görme -İngilizce ve bilinen tabiriyle Computer Vision- uzun yıllar yapay zekanın bir alt dalı olarak görülürken, özellikle ekran kartlarındaki gelişim ve makine öğrenmesinin bir üst versiyonu diyebileceğimiz ‘Derin Öğrenme’ algoritmalarının kabiliyetleri sayesinde bize pek çok fırsat sunmaya başladı. İnsan gözünün sahip olduğu yeteneğe benzer bir yeteneği bilgisayarlara kazandırmak olarak tarif edebileceğimiz bu teknolojinin başlı başına bir bilim dalı haline gelmesinde en önemli sebepse, teknolojinin sahip olduğu alt dallar.

Bilgisayarlı Görme süreci nesneleri algılama ve ayırt etme üzerine bir süreç ve bunu yapabilmek için;

Görüntü Edinimi (Image Acquisition): Nesneden çıkan fotonların yakalanıp görüntü haline gelmesi aşaması,

Görüntü İşleme (Image Processing): Nesnenin görüntüsünün işlenerek istenilen özelliklerin çıkarılmasına zemin hazırlanması aşaması,

Özellik Çıkarma (Feature Extraction): Tutulan resmin karakteristik özelliklerinin çıkartılması,

Hazırlanma (Training): Algoritmanın geliştirilmesi ve sınıf özelliklerine uygun olarak herhangi bir bilinmeyen verildiğinde hangi sınıfta olduğunu gösterecek yolların bulunması, yani sınıfların matematiksel modellerinin çıkarılması,

Tanıma (Recognition): Hazırlanma kısmında geliştirilen algoritmaya göre herhangi bir bilinmeyen verildiğinde onun sınıfının bulunması, yani hazırlanma bölümündeki modellere göre bilinmeyenin sınıfının bulunması,

Yorumlama ve Anlama (Interpretation and Understanding): Analizin sonuçlanması ve bilgisayarlı görmenin amacı olan kullanışlı kararlar verme sonucuna ulaşılması aşamalarını geçiriyor.

Buraya kadarki kısım çok teknik geldiyse, aslında ‘bir çift gözün yaptığı şeyleri bölümlere ayıran ve her bir bölümü dallara ayıran bir yapay zeka’ tanımını da kullanabiliriz.

FOTOĞRAFTAN KANSERİ ANLAMAK

Görüntü işleme olarak uzun süredir bildiğimiz ve temel olarak bir resmi ya da videoyu karakteristik özelliklerine ayırma işi olarak tanımladığımız meselenin babası sayılabilir bilgisayarlı görüntüleme. Görüntü işleme konusunu tanımlarken kullandığımız, karakteristik özelliklerine ayırma işi aslında bir görüntüde ayırt edici nitelik kazandırmaya dayanıyor.

Kareyi daireden ayıran şeyi bir insan olarak çok kolay tanımlıyoruz. Görüntü işleme ile yapılmaya çalışılan ise bunu bilgisayarların da anlamasını sağlamak. Bir üst başlık olan Bilgisayarlı Görme ise bunu parçalara ayırarak farklı farklı başlıklarla bir bütüne hizmet etmeye çalışıyor.

Buraya kadar okumaktan vazgeçmediyseniz şimdi daha anlaşılır bir şekilde Bilgisayarlı Görme’nin hayatımızın hangi noktalarına dokunacağını konuşabiliriz. 

Boş bir masa hayal edin. Bir masa ve üzerinde ayırt edici nitelikte özelliklere sahip bir malzeme yok. Mesela bir elma şimdi; rengi, şekli, sapı ve ona elma dememizi sağlayacak tüm ayırt edici nitelikler. Yani niye ona portakal demiyorsak hepsi.

Şimdi bu yeteneğin aynısını bir bilgisayara kazandırdığımızı düşünün. Bu bağlamda Bilgisayarlı Görme’nin amacı; duyumsanan veriye göre, nesneler ve maddeler hakkında kullanışlı kararlar verebilmek.

Görsel olarak algılanabilir, maddesel olan tüm nesneleri ayırt edebilen ve bununla ilgili bizim ondan yapmasını istediğimiz görevleri yerine getiren bilgisayarlar… Dünyada birbirinden ayrıştırıcı özelliği olan 30 bin nesne kategorisi olduğu düşünülürse insan gözünden fazlasına ihtiyacımız olduğu kesin. Hele ki konu bir fotoğrafa bakıp o kişinin kanser olup olmadığını anlamak ya da başka bir fotoğrafa bakarak kaza yapmış araçtaki kusurun kime ait olduğunu tahmin etmek olunca mesele daha da önem kazanıyor. Bilgisayarlı Görme’yi bu kadar popüler yapan ise hemen her endüstrideki potansiyel faydaları. İnsansız araçların çok temel olarak bir bilgisayarlı görme ürünü olduğunu söylemek yapay zekaya haksızlık sayılmaz ne de olsa.

Okan Utkueri – okanutkueri@gmail.com  /  Ali Erhan Tamer – ali@botudio.com

 

11 Eylül 2018

İlgili Haberler

Yazarlar