Görüntü işleme yöntemleri ve algoritmaları. Görüntü ön işleme algoritmaları. Örüntü tanıma için sinir ağlarının uygulanması

1 numaralı laboratuvar çalışması

Görüntü İşleme Algoritmaları

Evrişim işlemi

Evrişim her ikisi için de kullanılabilecek çok geniş çapta uygulanabilir bir algoritmadır. ön arıtma görüntüler ve nesnelerin tanınması ve tanımlanması için. Görüntünün iki boyutlu bir parlaklık matrisi ile belirtilmesine izin verin F" ve dürtü tepki matrisi H. Bir matrisi matematiksel olarak evriştirin Fçekirdek ile H aşağıdaki formülle belirlenebilir:

Nerede M2xN2 - evrişim çekirdek matrisinin boyutu. Matris boyutu F(M1+M2-1)x(N1+N2-1)'e eşittir, burada M1xN1 - orijinal matrisin boyutu F" . Matris F Matrisin kenarlarına bazı kurallara göre elemanlar eklenerek istenilen boyuta getirilmesiyle orijinalinden elde edilir. Genellikle kenarlardaki orijinal matris, matris genişliğinin yarısı kadar sıfırlarla doldurulur H sola ve sağa ve buna göre yüksekliğin yarısı kadar yukarı ve aynı miktarda aşağı. Daha sonra elde edilen matrisin boyutu R matris ile aynı olacak F" .

Evrişim, yukarıda gösterildiği gibi, bir matrisin diğerinin üzerinde "çalıştırılmasıyla" doğrudan hesaplanabilir. İncirde. Şekil 1, evrişimi hesaplamak için bir diyagramı göstermektedir (maske matrisinin boyutu 3x3 olarak alınmıştır). Evrişim operatörü, seçilen bir görüntü parçasıyla öğe bazında çarpılan ve daha sonra filtrelenen görüntünün yeni bir öğe değerini elde etmek için toplanan katsayılardan (maskelerden) oluşan bir matris olarak düşünülebilir. Bu matris herhangi bir boyutta olabilir, mutlaka kare olmayabilir.

Pirinç. 1. Evrişim işleminin uygulanması.

Egzersiz yapmak

Orijinal görüntüyü bir maske matrisiyle evriştirme işlemini gerçekleştiren bir algoritma uygulayın.

Maske matrisinin boyutu ve türü kullanıcı tarafından belirlenir.

Çeşitli görüntü işleme algoritmalarını uygulamak için aşağıdaki maske matrislerini kullanın:

Görüntüdeki gürültüyü yumuşatmak ve bastırmak için aşağıdaki türde 3x3 matris maskesi kullanın:

Konturları vurgulamak için aşağıdaki türdeki matris maskeleri kullanılır:

1/9*

Konturları vurgulamak için aşağıdaki türde bir maske kullanın:

4. Nokta ve darbe gürültüsünü bastırmak için kullanılan bir medyan filtre uygulayın. Bir görüntü pikseli ve söz konusu alandaki komşuları, bir varyasyon serisi halinde (piksel değerlerinin artan veya azalan sırasına göre) düzenlenir ve bu varyasyon serisinin merkezi değeri, yeni bir piksel değeri olarak seçilir. Ortalama filtrelemenin sonucu, görüntüde bulunan herhangi bir rastgele gürültünün etkili bir şekilde ortadan kaldırılmasıdır. Bunun nedeni, söz konusu bölgedeki piksel yoğunluğundaki herhangi bir rastgele ani değişikliğin sıralanmasıdır; o bölgenin sıralı değerlerinin en üstüne veya en altına yerleştirilecek ve yeni eleman değeri için her zaman merkez değer seçildiğinden sayılmayacaktır.

5. Kabartma algoritmasını uygulayın. Kabartma, konturların ortalamasını almak veya vurgulamak için kullanılan algoritmalara benzer şekilde yapılır. Görüntüdeki her piksel, 3x3'lük bir kabartma çekirdeği (matris maskesi) tarafından işlenir. Örneğin, aşağıdaki maske matrisini kabartma çekirdeği olarak alabilirsiniz:

Piksel değeri kabartma çekirdeği tarafından işlendikten sonra buna 128 eklenir. Böylece arka plan piksellerinin değeri orta gri bir renk haline gelir (kırmızı = 128, yeşil = 128, mavi = 128). 255'ten büyük tutarlar 255'e yuvarlanabilir.

Görüntünün kabartmalı versiyonunda konturlar yüzeyin üzerine çıkmış gibi görünüyor. Görüntünün aydınlatma yönü, çekirdekteki 1 ve -1 konumları değiştirilerek değiştirilebilir. Örneğin 1 ve -1 değerlerini değiştirirseniz arka ışık yönü tersine döner.

6. Görüntünün sulu boya ile renklendirilmesi. Suluboya filtresi görüntüyü dönüştürür ve işlendikten sonra sulu boyayla boyanmış gibi görünür:

Suluboya filtresi uygulamanın ilk adımı görüntüdeki renkleri yumuşatmaktır. Yumuşatma yöntemlerinden biri, her noktada ortalama bir ortalama renk kullanmaktır. Her pikselin ve 24 komşusunun renk değeri (maske matrisinin boyutu 5x5'tir), azalan veya artan sırayla bir varyasyon serisi halinde düzenlenir. Varyasyon serisindeki medyan (on üçüncü) renk değeri merkezi piksele atanır.

Renkleri yumuşattıktan sonra renk geçişlerinin sınırlarını vurgulamak için kenar iyileştirme filtresi uygulamanız gerekir.

DİJİTAL TEDAVİ SİNYALLER

Konu 17. GÖRÜNTÜ İŞLEME

İnsan hayal gücünün yapmaya cesaret edebileceği hiçbir şey yoktur.

Titus Lucretius. Romalı filozof ve şair. 1. yüzyıl M.Ö e.

Hayal kurmak iyi bir şeydir. Ama evsiz bir insanı bodrumdan çıkarmak, onu yıkamak, Apollo'ya dönüştürmek, kibrit kutusuna koyup bir arkadaşına göndermek e-posta iyi grafik programı daha iyisini yapacak.

Anatoly Pyshmintsev, Ural okulundan Novosibirsk jeofizikçisi. XX yüzyıl

Giriiş.

1. Temel kavramlar. Grafik gösterimi Görüntüler. Bilgisayar grafiklerinde rengin temsili. RGB renk modeli. CIE XYZ renk sistemi.

2. Raster görüntülerin geometrik dönüşümleri. Dönüşüm alanları ve aşamaları. Örnekleme. İki boyutlu bir sinyalin yeniden inşası için enterpolasyon serisi. Görüntülerdeki frekans bozulmaları ve bunların giderilmesi. Görüntülerin yeniden örneklenmesi.

3. Görüntü filtreleme. Doğrusal filtreler. Kenar yumuşatma filtreleri. Kontrast geliştirme filtreleri. Fark filtreleri. İki boyutlu döngüsel evrişim. Doğrusal olmayan filtreler. Eşik filtreleme. Medyan filtreleme. Ekstrem filtreler.

4. Görüntü sıkıştırma. Tekrar uzunluğu kodlama (RLE) algoritmaları. Sözlük algoritmaları. İstatistiksel kodlama algoritmaları. Kayıplı görüntü sıkıştırma. Görüntülerdeki kaybın tahmini. Fourier dönüşümü. Dalgacık dönüşümü.

GİRİİŞ

Dijital görüntüleme alanındaki araştırmaların kapsamı hızla büyüyor. Bu, görüntü işlemenin çok boyutlu sinyallerin işlenmesi olduğu ve gerçek dünyadaki çoğu sinyalin çok boyutlu olduğu gerçeğiyle belirlenir.

Matematiksel gösterimdeki bir görüntü, büyük miktarda bilgi taşıyan iki boyutlu bir sinyaldir. 500 × 500 öğeden oluşan renkli bir görüntü, birkaç yüz bin baytlık bir dizidir. Bu tür bilgiler yalnızca hesaplamaların rasyonel organizasyonu ile işlenebilir. Belirli görüntü işleme görevleri için şunları kullanabilirsiniz: etkili yollar Bu özel görevin özelliklerini ve sınırlamalarını dikkate alarak işleme. Ancak geniş bir problem sınıfını çözmek için görüntü işlemeden bahsedersek, o zaman keyfi problemleri çözmek için algoritmaların oluşturulabileceği bir dizi standart işlemi tanımlamak gerekir. Bunlar doğrusal dönüşümleri, 2B evrişimi ve 2B ayrık Fourier dönüşümünü içerir.

Ancak doğrusal olmayan dönüşümler de görüntü işlemede yaygın olarak kullanılmaktadır. Resimlerin özelliği şu bireysel unsurlar görüntüler komşu öğelerle belirli bir bağlantı içindedir. Bu nedenle, çoğu görüntü dönüştürme algoritması doğası gereği yereldir, yani görüntüleri, verilenin çevresinde bulunan öğe gruplarına göre işler. Doğrusal dönüşümler yerellik özelliğini karşılar ve hesaplama karmaşıklığı çevredeki mahallenin boyutuna çok az bağlı olan algoritmaların oluşturulmasına izin verir. Doğrusal olmayan görüntü dönüşümleri için aynı özellikler gereklidir. Bu tür dönüşümlerin sınıfı, görüntülerin yerel sıralama istatistiklerinin hesaplanmasına dayanan, sıralama filtreleme algoritmaları adı verilen algoritmaları içerir. Sıralama istatistikleri ve türevleri hesaplanırken görsellerin bilgi fazlalığından dolayı basitleştirmeler yapılabilir. Bu sınıfın en ünlü algoritması medyan filtreleme algoritmasıdır. Sıralama algoritmalarının diğer örnekleri, analiz edilen görüntü öğesini komşuluktaki maksimum veya minimumla değiştiren aşırı filtreleme algoritmalarını içerir. Sıralama algoritmalarının diğer bir özelliği, işlenmiş görüntünün özelliklerine yerel adaptasyon ve bunların yalnızca yumuşatma ve gürültü giderme için değil, aynı zamanda otomatik görüntü tanımadaki özelliklerin vurgulanması için de kullanılma potansiyelidir.

Görüntü işlemede, tek boyutlu sinyallerin işlenmesine yönelik yöntemler, eğer bunlar çok boyutlu sinyallere genelleştirilebiliyorsa, yaygın olarak kullanılır. Aynı zamanda çok boyutlu sistemleri açıklamaya yönelik matematiksel yöntemlerin tam olmadığını da hesaba katmak gerekir. Çok boyutlu sistemler çok sayıda serbestlik derecesine sahiptir ve tasarımları, tek boyutlu sistemlerin özelliği olmayan esneklik kazanır. Aynı zamanda, çok boyutlu polinomlar asal faktörlere ayrıştırılamaz, bu da çok boyutlu sistemlerin analizini ve sentezini zorlaştırır.

17.1. Temel konseptler

Görüntülerin grafiksel gösterimi. Grafik bilgisini iki boyutlu bir düzlemde (monitör ekranı) sunmak için iki yaklaşım kullanılır: raster ve vektör.

Vektör yaklaşımıyla grafik bilgisi bir dizi soyut geometrik nesne (düz çizgiler, bölümler, eğriler, dikdörtgenler vb.) olarak tanımlanır. Vektör tanımı, görüntünün yapısı hakkında önsel bilgiyi varsayar.

Raster grafikler, raster biçimindeki rastgele görüntülerle çalışır. Raster, düzlemdeki bir görüntünün, onu normal bir ızgara üzerinde aynı öğelere bölerek (örnekleyerek) ve her öğeye kendi rengini ve diğer nitelikleri atayarak tanımlanmasıdır. En basit raster dikdörtgendir, görüntü aktarımı için örnek sayısı açısından en ekonomik olanı altıgendir. Matematiksel açıdan bakıldığında, raster, sürekli bir görüntü fonksiyonunun düzleminde parçalı sabit bir yaklaşımdır.

Raster elemanına piksel denir. Standart piksel tanımlama:

f(i, j) = (A(i, j),C(i, j))), (17.1.1)

burada A(i, j) Ì R2 piksel alanıdır, C(i, j) Î C piksel niteliğidir (genellikle renk). En sık kullanılan iki tür özellik vardır:

C(i, j) = I(i, j) - piksel yoğunluğu (parlaklık);

C(i, j) = (R(i, j), G(i, j), B(i, j)) - RGB renk modelindeki renk nitelikleri.

Matris formunda:

Mij = (Aij, Cij).

Sürekli görüntüleri ayrıklaştırırken, Aij değerleri iki şekilde tanımlanabilir; ya Cij niteliklerinin tanımlandığı Aij = (i, j) noktalarının değerleri olarak ya da değerleri olarak tanımlanabilir. Aij = (i, i+1) × (j, j+1) kareleri veya Cij bu şeklin içindeki ortalama değerlerle belirlenen herhangi bir şekil (Şekil 17.1.1).

Uygulamada, kural olarak, X ve Y, raster genişliğinin yüksekliğe en boy oranına (en boy oranı) sahip, örneğin " şeklinde yazılan, kare veya dikdörtgen bir rasterin negatif olmayan tamsayılarının sınırlı kümeleridir. 4:3".

Bilgisayar grafiklerinde rengin temsili. Renk kavramı, insan gözünün elektromanyetik dalgaları algılamasına dayanmaktadır. belirli aralık sıklık Tarafımızca algılanan gün ışığı 400 nm'den (mor) 700 nm'ye (kırmızı) kadar λ dalga boylarına sahiptir. Işık akısı, spektral fonksiyonu I(λ) ile tanımlanabilir. Spektrumu yalnızca belirli bir dalga boyuna sahipse ışık monokromatik olarak adlandırılır.

Gözün retinasında iki tip reseptör vardır: çubuklar ve koniler. Çubukların spektral duyarlılığı (Şekil 17.1.2) gelen ışığın parlaklığıyla doğru orantılıdır. Koniler üç türe ayrılır; her biri kırmızı, yeşil ve mavide maksimumlarla sınırlı aralıklarda belirli bir duyarlılığa sahiptir ve karanlıkta duyarlılıklarını keskin bir şekilde kaybeder. Gözün maviye duyarlılığı diğer ikisine göre çok daha düşüktür. İnsanın ışık algısının önemli bir özelliği, farklı dalga boylarına sahip renkler eklenirken doğrusallıktır.

RGB renk modeli (Kırmızı, Yeşil, Mavi - kırmızı, yeşil, mavi) şu anda bilgisayar grafiklerinde en yaygın olanıdır. Bu modelde, spektral fonksiyon, R, G ve B olarak gösterilen, negatif olmayan ağırlık katsayılarına (0'dan 1'e kadar normalleştirilmiş) sahip her koni tipi için hassasiyet eğrilerinin toplamı olarak temsil edilir. Model şu özellik ile karakterize edilir: yeni renkler elde etmek için toplanabilirlik. Örneğin, spektral fonksiyonların kodlanması:

Siyah: fsiyah = 0, (R, G, B) = (0,0,0);

Menekşe rengi fmor = fred + fmavi, (R, G, B) = (1,0,1);

Beyaz fbeyaz = fred + fyeşil + fmavi, (R, G, B) = (1,1,1).

RGB modelinin üç boyutlu renk uzayı Şekil 2’de gösterilmektedir. 17.1.3. Alıcıların ışık algılamasının özellikleri nedeniyle, insanların görebildiği tüm renkler bu modelde temsil edilememektedir. Ancak yeniden üretilen renklerin oranı, bu modelde temsil edilmeyen orandan önemli ölçüde daha fazladır.

CIE XYZ renk sistemi. Uluslararası renk temsili standardı CIE (CIE - Commission Internationale de l'Eclairage), 1931 yılında Uluslararası Aydınlatma Komisyonu tarafından kabul edilmiştir. Bu standart, ρX(λ), ρY(λ), ρZ(λ) temel fonksiyonlarını tanımlar. dalga boyu Negatif olmayan katsayılara (X, Y ve Z) sahip doğrusal kombinasyonlar, insanlar tarafından görülebilen tüm renkleri elde etmemizi sağlar. Bu işlevler, üç boyutlu uzayda ışık yoğunluğunun göreceli algısını hesaba katar. CIE renk sistemi ilk çeyrekte bir koni oluşturur ve renkli görüntülerin yüksek kalitede görüntülenmesi için kullanılır.

17.2. Raster görüntülerin geometrik dönüşümleri

Dönüşüm alanları ve aşamaları. Görüntüler doku ve ayrıntıya ayrılabilir. Doku görüntülerinde tüm örnekler (öğeler) bilgi taşır (TV ekranındaki görüntü). Ayrıntılı görüntü, engelleyici nesneleri, arka planı ve yararlı nesneleri tanımlayabileceğiniz görüntüdür.

Bilgisayarlarda üç ana grup görüntü işleme algoritması vardır:

1. Restorasyon, rastgele gürültüden arındırma, kaliteyi iyileştirme, geometrik bozulmaları düzeltme amacıyla birincil (ön) görüntü işleme optik sistemler(odaklanma, sapmalar vb.).

2. Görüntülerin tanımı, örüntü tanıma. Görüntü ayrıntılarının parametrelerini belirlemek için gerçekleştirilir ve şunları içerir: görüntünün aydınlatma seviyesi ve rengi bakımından aynı olan alanlarının bulunması, görüntülerin şeklinin özelliklerinin belirlenmesi, nesnelerin özel noktalarının koordinatlarının belirlenmesi vb.

3. İletim ve depolama hacmini azaltmak için verimli kodlama.

Çoğu ön işleme yöntemi, doğrusal uzamsal olarak değişmez (SPI) filtrelerin kullanımına dayanmaktadır. Doğrusal algoritmalar, tek boyutlu FIR ve IIR filtrelerinin iki boyutlu analogları kullanılarak gerçekleştirilir. Örneğin görüntülerdeki gürültüyü azaltmak için filtreler uygulanırken kullanılabilirler.

FIR filtreleri evrişim yöntemi kullanılarak uygulanır. 2D FIR filtrelerinin avantajları netlik, basitlik ve mutlak sağlamlıktır. IIR filtreleri fark denklemleri ve z-dönüşümleri kullanılarak uygulanır. FIR filtrelerinden daha hızlıdırlar ancak kararsız olabilirler. İki boyutlu IIR filtrelerinin sentezi, tek boyutlu olanların sentezinden farklıdır çünkü iki boyutlu bir fonksiyon için kutupları açıkça tanımlamak mümkün değildir.

Görüntüleri geri yüklemek ve kalitelerini artırmak için doğrusal olmayan yöntemler de gerekli olabilir. Örneğin, gürültüyü bastırmak ve aynı zamanda görüntülerin kontur kısmını korumak için, sıralama algoritmaları tarafından uygulanan doğrusal olmayan veya doğrusal, uzaysal olarak değişmez olmayan (SPNI) filtrelerin kullanılması gerekir. Tüm sıralı doğrusal olmayan filtreler, yerel histogramların hesaplanmasına yönelik hızlı algoritmalara dayanmaktadır.

Bu yöntemlerden biri medyan filtrelemedir. Medyan filtrelerin kullanımı, sinyali aynı anda bozmadan belirli gürültü türlerini ve periyodik parazitleri bastırmak için etkilidir; örneğin, düşen çizgiler de dahil olmak üzere gürültü patlamalarının patlamalarını bastırmak için. Yöntem aynı zamanda tanımayla ilgili sorunları çözmek için de (örneğin, ince çizgileri ve küçük izole nesneleri tanımlamak için) kullanılabilir.

Görüntü tanımlama ve örüntü tanıma algoritmaları genellikle doğrusal değildir ve buluşsal niteliktedir. Nesnelerin özellikleri genellikle nesne görüntüsünün alanı, görüntü çevresinin çevresi, alanın görüntü çevresinin karesine oranıdır. Bir nesnenin şekli, görüntüde yazılı olan veya nesnenin görüntüsünün etrafında tanımlanan bir dairenin yarıçapı, görüntünün "kütle merkezinden" minimum ve maksimum yarıçap vektörünün uzunluğu ile karakterize edilebilir.

Örnekleme. Bilgisayardaki görüntü dönüşümleri ve işlenen verilerin depolanması ayrık biçimde gerçekleştirilir. Örnekleme, gerçek dünyanın sürekli analog görüntülerinden ayrık bir temsil elde etmek için kullanılır. Pratikte giriş cihazları ( dijital kamera, tarayıcı veya diğerleri). Çıkış cihazlarında (ekran, çizici vb.) işlenmiş görüntülerin görsel olarak algılanması için analog görüntü, örneklenmiş temsilinden yeniden oluşturulur.

Siyah beyaz görüntülerin en basit durumunda, elimizdeki iki boyutlu dizi sa(x, y). RGB modelindeki renkli görüntüler için, renkler eklenirken toplanabilirlik özelliği dikkate alınarak, her R, G ve B katmanı, sonuçların daha sonra toplanmasıyla birlikte iki boyutlu bir dizi olarak düşünülebilir ve işlenebilir.

Tek boyutlu periyodik ayrıklaştırmayı iki boyutlu duruma genelleştirmenin yollarından en basiti, dikdörtgen koordinatlarda periyodik ayrıklaştırmadır:

s(n, m) = sa(nDx, mDy),

burada Dx ve Dy, sürekli x ve y koordinatlarına sahip iki boyutlu sürekli bir sa(x, y) sinyalinin yatay ve dikey örnekleme aralıklarıdır. Aşağıda Dx ve Dy değerleri tek boyutlu durumda olduğu gibi 1'e eşit alınmıştır.

İki boyutlu bir sinyalin örneklenmesi aynı zamanda spektrumunun periyodikleştirilmesine de yol açar ve bunun tersi de geçerlidir. Ayrı bir sinyalin koordinat ve frekans gösterimlerinin bilgi eşdeğerliği koşulu, sinyalin ana aralıklarında eşit sayıda örnekleme noktasıyla da korunur. Dikdörtgen örnekleme için ileri ve ters Fourier dönüşümleri şu şekilde verilir:

S(k, l) =s(n, m) exp(-jn2pk/N-jm2pl/M), (17.2.1)

S(k, l) =exp(-jn2pk/N) s(n, m) exp(-jm2pl/M), (17.2.1")

s(n, m) =S(k, l) exp(-jn2pk/N-jm2pl/M). (17.2.2)

s(n, m) =ifade(-jn2pk/N) S(k, l) tecrübe(-jm2pl/M). (17.2.2")

Pirinç. 17.2.1. Spektrumun periyodizasyonu.

Bu ifadeler, dikdörtgen bir veri örnekleme rasterinden iki boyutlu bir DFT'nin, tek boyutlu sıralı DFT'ler kullanılarak hesaplanabileceğini göstermektedir. (17.2.1") ve (17.2.2") ifadelerinin ikinci toplamları, sırasıyla n ve k doğruları boyunca s(n, m) ve S(k, l) fonksiyonlarının bölümlerinin tek boyutlu DFT'leridir ve ilki, m ve l'ye göre bölümlerde hesaplanan fonksiyonların tek boyutlu DFT'leridir. Başka bir deyişle, kaynak matrisler s(n, m) ve S(k, l) değerleri ilk önce satırlarda (veya sütunlarda) DFT'li ara matrislere ve ara matrisler, sütunlarda (veya sırasıyla satırlarda) DFT'li son matrislere yeniden hesaplanır.

Fx=1/Dx ve Fy=1/Dy frekansına sahip bir analog sinyalin örneklenmesinden kaynaklanan spektrumun periyodik tekrarı için (Şekil 17.2.1), ana frekans aralığında spektrumun değişmemesi için (Şekil 17.2.1). orijinal analog sinyalin spektrumuna göre), analog sinyalin spektrumundaki maksimum frekans bileşenleri fmax'ın hem satırlar hem de sütunlar halinde Nyquist frekansını (fmax. x £ fN) aşmaması gerekli ve yeterlidir. = Fx/2, fmax y £ fM = Fy/2). Bu, sinyal örnekleme oranının, sinyal spektrumundaki maksimum frekans bileşeninin en az iki katı kadar yüksek olması gerektiği anlamına gelir:

Fx ³ 2fmaks. x, Fy ³ 2fmaks. y, (17.2.3)

bu da spektral fonksiyonların ana spektrum aralığının uçlarında sıfır değerlere ulaşmasını sağlar.

İki boyutlu bir sinyalin yeniden inşası için enterpolasyon serisi. Sürekli sinyal sa(x, y) sınırlı spektrumlu bir sinyalse ve örnekleme periyotları, bitişik periyotların spektrumları örtüşmeyecek kadar küçük seçilirse:

|Wx|p/Dx, |Wy|p/Dx için Sa(Wx, Wy) = 0,

daha sonra, tek boyutlu durumda olduğu gibi, sa(x, y) sinyali, Kotelnikov-Shannon serisinin iki boyutlu bir analoğu kullanılarak ayrı bir sinyalden yeniden oluşturulabilir:

sa(x, y) = Sn Sm s(n, m) . (17.2.4)

Görüntülerdeki frekans bozulmaları ve bunların giderilmesi. Sınırsız spektrumlu bir sinyal de örneklenebilir, ancak bu durumda bitişik periyotlarda spektrumların örtüşmesi söz konusudur ve yüksek frekanslar, daha yüksek Nyquist frekansları, tek boyutlu durumda olduğu gibi, aşağıdaki koşullar altında "maskelenecektir": düşük frekanslar ana dönem. Periyodun sınırlarından gelen "yansımanın" etkisi, farklı koordinatlar boyunca yansıyan frekansların girişimi nedeniyle daha da karmaşık bir tablo ortaya çıkarır. Aliasing olarak bilinen benzer bir etki, görüntü örnekleme hızı yetersiz olduğunda da gözlemlenecektir. Bu etki özellikle parlaklıktaki keskin kontrast değişikliklerinde net bir şekilde gözlemlenebilir.

Bu tür olaylarla mücadele etmek için, ön filtreleme (antialiasing) kullanılır - analog görüntünün, örtüşmeye yol açabilecek yüksek frekanslı bileşenleri kesen bir ağırlıklandırma filtresi işleviyle ön evrişimi. İki boyutlu durumda filtreleme şu şekilde tanımlanır:

z(x, y) = h(x", y") ③③ s(x-x", y-y"). (17.2.5)

Analog görüntülerin yalnızca optik aralıkta, örneğin ekranda, fotoğraf kağıdında veya filmde ışık gösterimi şeklinde mevcut olduğu, ancak bilgisayar belleğinde bulunamayacağı belirtilmelidir. Bu nedenle, ön filtrelemenin fiziksel uygulaması yalnızca bir görüntüyü, kural olarak kullanılmayan, odak dışı bırakılarak kaydederken mümkündür. Birincil bilgiler her zaman maksimum eksiksizlik ve doğrulukla kaydedilmelidir ve birincil bilgilerin gereksiz ayrıntılardan ve artıklardan temizlenmesi daha sonraki veri işleme meselesidir. Bu nedenle, denklem 17.2.5 ile ilgili olarak, iki boyutlu ön filtreleme, pratik uygulamasında, yalnızca ana frekans aralığı üzerinde (aşırı çözünürlükle) geniş bir marjla örneklenen görüntülerin filtrelenmesini temsil edebilir ve kural olarak kullanılır: örneğin görüntüleri sıkıştırırken daha büyük bir adıma yeniden örnekleme yaparken. Ön filtreleme aynı zamanda görüntü oluşturma algoritmalarına da yerleştirilebilir.

İncirde. 17.2.3 ve altında, Tablo 17.2.1 kenar yumuşatma için en yaygın tek boyutlu filtrelerin örneklerini göstermektedir. Analog filtreler şeklinde de uygulanabilirler ve örneğin televizyon görüntü satırlarının radyo kanalları üzerinden analog biçimde iletilmesinde (yatay antialiasing) kullanılabilirler. Prensip olarak, sütunlar arasında benzer bir işlem gerçekleştirilebilir (çift görüntü) ve görüntünün toplanmasından sonra tam bir kenar yumuşatma işlemi gerçekleştirilecektir, ancak bu yöntem daha çok özel bilimsel araştırma alanına aittir.

Tablo 17.2.1.

Temel ağırlık fonksiyonları

Zaman penceresi	Ağırlık fonksiyonu	Fourier resmi
Doğal (P)	P(t) = 1, \|t\|£t; П(t) = 0, \|t\|>t	П(w) = 2t çünkü
Bartlett (D)		B(w) = t sinc2(ağ/2).
Henninga, Ganna	p(t) = 0,5	0,5P(w)+0,25P(w+p/d)+0,25P(w-p/d)
Hemming	p(t) = 0,54+0,46 cos(pt/t)	0,54P(w)+0,23P(w+p/d)+0,23P(w-p/d)
Carré (2. pencere)	p(t) = b(t) sinc(pt/t)	\|w\| için t·B(w)*П(w), П(w) = 1
Laplace-Gaussian	p(t) = tecrübe[-b2(t/t)2/2]	[(t/b) exp(-t2w2/(2b2))] ③ П(w)

Tek boyutlu f1(x) filtrelerinin iki boyutlu analogları iki simetri seçeneğiyle veya yarıçapın bir fonksiyonu olarak oluşturulur:

f2(x, y) = f1(),

veya bir eser olarak:

f2(x, y) = f1(x) × f1(y).

İlk seçenek daha doğrudur, ancak ikincisi ayrılabilirlik özelliğine sahiptir, yani iki boyutlu evrişim, f1(x) ile satırlar boyunca ve f1(y) ile sütunlar boyunca sıralı olarak iki tek boyutlu evrişim ile gerçekleştirilebilir.

Görüntü yeniden örnekleme veya yeniden örnekleme, dijital bir sinyalin örnekleme frekansındaki bir değişikliktir. Dijital görüntülere uygulandığında bu, görüntünün yeniden boyutlandırılması anlamına gelir.

Çeşitli görüntü yeniden örnekleme algoritmaları vardır. Örneğin çift doğrusal enterpolasyon yöntemini kullanarak bir görüntüyü 2 kat büyütmek için, bitişik sütun ve satırların değerlerinin doğrusal enterpolasyonuyla ara sütunlar ve satırlar elde edilir. Yeni görüntünün her noktası, orijinal görüntüdeki daha fazla sayıda noktanın ağırlıklı toplamı olarak elde edilebilir (çift kübik ve diğer enterpolasyon türleri). En yüksek kalitede yeniden örnekleme, sinyalin yalnızca zaman alanını değil aynı zamanda frekans alanını da hesaba katan algoritmalar kullanıldığında elde edilir.

Görüntü frekans bilgisinin maksimum düzeyde korunduğu bir yeniden örnekleme algoritması düşünelim. Algoritmanın tek boyutlu sinyaller üzerindeki çalışmasını ele alacağız, çünkü iki boyutlu bir görüntü önce yatay olarak (satırlar boyunca) ve ardından dikey olarak (sütunlar boyunca) uzatılabilir veya sıkıştırılabilir ve iki boyutlu bir görüntünün yeniden örneklemesi yeniden örneklemeye indirgenebilir. tek boyutlu sinyallerden oluşur.

Diyelim ki, 0-T aralığında belirtilen ve Dt=1 (N aralık) adımıyla örneklenen tek boyutlu bir sinyalimiz var (Şekil 17.2.4). Sinyali m kez "uzatmak" gerekir. Şekilde gösterilen sinyal spektrumu hızlı Fourier dönüşümü (FFT, spektrum örneklerinin sayısı sinyal örneklerinin sayısına eşittir) ile hesaplanır ve ana FFT aralığında (0-2p, Nyquist frekansı wN = p/Dt) verilir. = p veya 0,5N, spektrum boyunca bir adımla spektrum örneklerinin numaralandırılmasına göre Df = 1/T veya Dw = 2p/T). Esneme gerçekleştirmek için 2 adım vardır.

İlk adım, sinyal uzunluğunu m kat artıran sıfır enterpolasyondur. (Şekil 17.2.5). Orijinal sinyalin tüm örneklerini m ile çarpmanız ve ardından her sinyal örneğinden sonra bir m-1 sıfır değeri eklemeniz gerekir. Değeri değişmeden kalan 0-T aralığı artık m kat daha fazla örnekleme aralığı (mN) içerir ve yeni örnekleme adımı Dx=Dt/m'ye eşit olacaktır. Buna göre bu sinyal için yeni Nyquist frekansı mp/Dt = mp'dir. Ancak frekans birimleri cinsinden spektrum adımının fiziksel değeri, sinyal ayar aralığının fiziksel değerinin (Df = 1/T) tersidir ve bu nedenle sinyalin mN noktalarından FFT, mN spektrum noktalarını hesaplayacaktır. orijinal sinyalin spektrum adımıyla birlikte 0-2pm ana FFT aralığı; burada orijinal sinyalin spektrumunun m-periyotlarını içerecektir (bir ana ve m-1 tarafı).

İkinci adım, zaman veya spektral alanda alçak geçiren bir filtre kullanarak spektrumun yan bantlarını filtrelemektir. İncirde. 17.2.6 spektrum temizlendi ve ters Fourier dönüşümü gerçekleştirildi; bu, tüm frekans bilgilerinin tam olarak korunduğu orijinal sinyalden m kat daha uzun bir sinyalle sonuçlandı.

Benzer bir prensip kullanılarak, adımların sırası ters çevrilerek, sinyali n kez sıkıştırmak (azaltmak) için bir algoritma oluşturulabilir. Bir sinyali sıkıştırırken, sinyal örnekleme adımı arttırılır ve buna göre Nyquist frekansı azaltılırken, kesilen yüksek frekanslar (sinyal spektrumunun gürültü ve önemsiz yüksek frekanslı kısımları) ana aralığın sınırından yansıtılacaktır. ve ana bilgilerle özetlenerek çarpıtma yaratır. Bu olguyu ortadan kaldırmak için, sinyal ilk önce yeni Nyquist frekansına eşit bir kesme frekansıyla (antialiasing) alçak geçişli filtreden geçirilir ve ancak bundan sonra sinyalin büyük bir kısmı kırım yoluyla yok edilir.

Yeniden örnekleme yalnızca zaman alanında gerçekleştirildiğinde, uzatma ve sıkıştırma algoritmaları, kural olarak, örnekleme adımında bir m/n oranı biçiminde bir değişiklik belirtilerek tek bir sıralı işlemde birleştirilir; bu, belirlemenize olanak tanır örnekleme adımını değiştirmenin kesirli değerleri için m ve n'nin tamsayı değerleri. Bu, algoritmaları önemli ölçüde basitleştirir ve işlerinin verimliliğini ve kalitesini artırır. Örneğin, m/n = 3/2'de bir sinyal 1,5 kat uzatıldığında, sinyal önce 3 kat uzatılır (tüm numunelere basit ve tekdüze sıfırlar eklenir, ardından alçak geçişli filtreleme gerçekleştirilir, ardından sinyal iki kat inceltilir. Ters sıkıştırma işleminde kesme frekansı birinci alçak geçiren filtrenin frekansıyla örtüştüğü için kenar yumuşatma filtresine gerek yoktur (örneğin, m/n = 2). /3), aynı şekilde yalnızca kenar yumuşatma filtresi kullanılır.

17.3. görüntü filtreleme

Görüntü filtreleme, belirli kurallara göre orijinal görüntüden elde edilen aynı boyutta bir görüntü elde edilmesiyle sonuçlanan bir işlemdir. Tipik olarak, ortaya çıkan görüntüdeki her pikselin yoğunluğu (rengi), orijinal görüntüdeki bazı komşuluklarında bulunan piksellerin yoğunlukları (renkleri) tarafından belirlenir.

Filtreleme kuralları çok çeşitli olabilir. Görüntü filtreleme, bilgisayarlı görme, örüntü tanıma ve görüntü işlemenin en temel işlemlerinden biridir. Görüntü işleme yöntemlerinin büyük çoğunluğunun çalışması, kaynak görüntülerin şu veya bu şekilde filtrelenmesiyle başlar.

Doğrusal filtreler çok basit bir matematiksel açıklaması var. Orijinal yarı tonlu görüntü A'nın verildiğini varsayacağız ve piksellerinin yoğunluklarını A(x, y) olarak göstereceğiz. Doğrusal bir filtre, raster üzerinde tanımlanan gerçek değerli bir h fonksiyonu (filtre çekirdeği) tarafından tanımlanır. Filtrelemenin kendisi ayrık evrişim (ağırlıklı toplama) işlemi kullanılarak gerçekleştirilir:

B(x, y) = h(i, j) ③③A(x, y) = h(i, j) A(x-i, y-j). (17.3.1)

Sonuç B görüntüsüdür. Tipik olarak, filtre çekirdeği yalnızca (0, 0) noktasının bazı N komşuluklarında sıfırdan farklıdır. Bu komşuluğun dışında h(i, j) sıfıra eşit veya sıfıra çok yakındır ve ihmal edilebilir. Toplama (i, j) О N üzerinde gerçekleştirilir ve her bir B(x, y) pikselinin değeri, (x, y) noktasında ortalanmış N penceresinde yer alan A görüntüsünün pikselleri tarafından belirlenir (gösterilir). N(x, y) ) kümesine göre. Dikdörtgen N komşuluğunda tanımlanan bir filtre çekirdeği, kenar uzunluklarının tek sayılar olduğu bir m x n matrisi olarak görülebilir. Bir çekirdeği matris olarak belirlerken ortalanmalıdır. Eğer bir (x, y) pikseli görüntünün kenarları yakınında bulunuyorsa, o zaman belirli (i, j) için A(x-i, y-j) koordinatları görüntünün dışında var olmayan A piksellerine karşılık gelebilir. Bu sorun birkaç yolla çözülebilir.

B görüntüsünün kenarlarını kırparak veya A görüntüsünün orijinal değerlerini değerlerine uygulayarak bu pikselleri filtrelemekten kaçının.

Eksik pikseli toplama dahil etmeyin, h(i, j) ağırlığını N(x, y) komşuluğundaki diğer pikseller arasında eşit olarak dağıtın.

Ekstrapolasyon kullanarak görüntü sınırlarının dışındaki piksel değerlerini belirleyin.

Görüntünün ayna devamını kullanarak görüntünün sınırlarının ötesindeki piksel değerlerini tanımlayın.

Yöntemin seçimi, belirli filtre ve görüntü özellikleri dikkate alınarak yapılır.

Kenar yumuşatma filtreleri. Yarıçapı r olan en basit dikdörtgen yumuşatma filtresi, tüm değerleri 1/(2r+1)2'ye eşit olan (2r+1) × (2r+1) boyutunda bir matris kullanılarak belirlenir ve değerler bire eşittir. Bu, alçak geçişli tek boyutlu hareketli ortalama U şeklindeki filtrenin iki boyutlu bir analogudur. Böyle bir çekirdekle filtreleme yapılırken piksel değeri, çevresi 2r+1 olan bir karedeki piksellerin ortalama değeri ile değiştirilir. 3×3 filtre maskesi örneği:

Filtrelerin bir kullanımı gürültü azaltmadır. Gürültü pikselden piksele bağımsız olarak değişir ve gürültü değerinin matematiksel beklentisinin sıfır olması koşuluyla, komşu piksellerin gürültüsü toplandığında birbirini iptal edecektir. Filtreleme penceresi ne kadar büyük olursa, ortalama gürültü yoğunluğu da o kadar düşük olacaktır, ancak aynı zamanda önemli görüntü ayrıntılarında buna karşılık gelen bir bulanıklık da olacaktır. Filtreleme sırasında (tek bir darbeye tepki) siyah bir arka plan üzerinde beyaz bir noktanın görüntüsü, tekdüze gri bir kare olacaktır.

Dikdörtgen filtre kullanarak gürültü azaltmanın önemli bir dezavantajı vardır: filtre maskesinde işlenenden herhangi bir mesafedeki tüm pikseller sonuç üzerinde aynı etkiye sahiptir. Merkezi noktanın ağırlığını artırarak filtreyi değiştirerek biraz daha iyi bir sonuç elde edilir:

İşlenen pikselden uzaklaştıkça piksellerin sonuç üzerindeki etkisi azalırsa daha etkili gürültü azaltma elde edilebilir. Çekirdeğe sahip bir Gauss filtresi şu özelliğe sahiptir: h(i, j) = (1/2ps2) exp(-(i2+j2)/2s2). Bir Gauss filtresinin sıfır olmayan sonsuz boyutta bir çekirdeği vardır. Bununla birlikte, filtre çekirdeğinin değerleri çok hızlı bir şekilde n'ye düşer ve bu nedenle pratikte kişi kendisini (0, 0) civarında küçük boyutlu bir pencereyle evrişimle sınırlandırabilir, örneğin pencere yarıçapını 3σ'ya eşit alarak .

Gauss filtreleme de yumuşatıcıdır. Ancak dikdörtgen filtreden farklı olarak Gauss filtreli bir noktanın görüntüsü, parlaklığın ortadan kenarlara doğru azaldığı, simetrik, bulanık bir nokta olacaktır. Görüntü bulanıklığının derecesi σ parametresi tarafından belirlenir.

Kontrast geliştirme filtreleri . Kenar yumuşatma filtreleri, görüntüyü bulanıklaştırarak yerel kontrastını azaltırken, kontrast artırıcı filtreler tam tersi etkiye sahiptir ve esasen yüksek uzaysal frekanslı filtrelerdir. (0, 0) noktasındaki kontrast arttırıcı filtrenin çekirdeği, 1'den büyük bir değere sahiptir ve değerlerin toplam toplamı 1'e eşittir. Örneğin, kontrast arttırıcı filtreler, matrisler tarafından tanımlanan bir çekirdeğe sahip filtrelerdir. :

. .

Filtre kullanımına bir örnek Şekil 2'de gösterilmektedir. 17.3.1. Kontrastı artırma etkisi, filtrenin komşu piksellerin yoğunlukları arasındaki farkı vurgulayarak bu yoğunlukları birbirinden uzaklaştırmasıyla elde edilir. Bu etki, çekirdeğin merkezi teriminin değeri ne kadar büyük olursa o kadar güçlü olacaktır. Doğrusal kontrastı artıran filtrelemenin karakteristik bir eseri, sınırların çevresinde fark edilebilir ışık ve daha az fark edilir koyu halelerdir.

Fark filtreleri – bunlar diferansiyel operatörlerin ayrık yaklaşımlarıyla belirlenen doğrusal filtrelerdir (sonlu farklar yöntemi kullanılarak). Bu filtreler birçok uygulamada, örneğin bir görüntüdeki kenarları bulmakta hayati bir rol oynar.

En basit diferansiyel operatör, sürekli fonksiyonlar için tanımlanan x koordinatı d/dx'e göre türevdir. Ayrık görüntüler için benzer operatörlerin yaygın çeşitleri Prewitt ve Sobel filtreleridir:

. .

Y koordinatı türev operatörü d/dy'ye yaklaşan filtreler, matrislerin yer değiştirmesi yoluyla elde edilir.

Gradyanın normunu üç bitişik noktadan hesaplamak için en basit algoritma:

G(x, y) = .

Basitleştirilmiş bir hesaplama formülü de kullanılır:

Dört bitişik nokta üzerindeki eğim normunun hesaplanması (Roberts operatörü):

Sobel algoritması, merkezi noktanın yakınında sekiz parlaklık örneği kullanır:

G(x, y) = , G(x, y) @ ,

Gxx, y = - ,

Gyx, y = - .

Sobel algoritması, degrade normunun daha doğru belirlenmesinin yanı sıra, görüntü analizi düzlemindeki degrade vektörünün yönünü, degrade vektörü ile matris satırlarının yönü arasındaki j açısı biçiminde belirlemeyi de mümkün kılar. :

j(x, y) = argtg(Gyx, y /Gxx, y).

Görüntünün ortalama yoğunluğunu değiştirmeyen yumuşatma ve kontrast arttırıcı filtrelerin aksine, fark operatörlerinin uygulanması genellikle sıfıra yakın ortalama piksel değerine sahip bir görüntüyle sonuçlanır. Orijinal görüntünün dikey farklılıkları (kenarlıkları), ortaya çıkan görüntüdeki büyük modül değerlerine sahip piksellere karşılık gelir. Bu nedenle fark filtrelerine nesne sınırı seçim filtreleri de denilmektedir.

Yukarıdaki filtrelere benzer şekilde, diğer diferansiyel operatörler için filtreler sonlu farklar yöntemi kullanılarak oluşturulabilir. Özellikle, birçok uygulama için önemli olan diferansiyel Laplace operatörü (Laplacian) D= 𝝏2/𝝏x2 + 𝝏2/𝝏y2, matrisli bir filtre kullanılarak ayrık görüntüler için yaklaşık olarak tahmin edilebilir (seçeneklerden biri):

Şekil 2'de görülebileceği gibi. 17.3.2, ayrık Laplace'ın kullanılması sonucunda mutlak değerdeki büyük değerler hem dikey hem de yatay parlaklık farklılıklarına karşılık gelir. Dolayısıyla filtre, herhangi bir yönelimin sınırlarını bulan bir filtredir. Bir görüntüdeki sınırların bulunması, bu filtre uygulanarak ve mutlak değeri belirli bir eşiği aşan tüm pikseller alınarak yapılabilir.

Ancak böyle bir algoritmanın önemli dezavantajları vardır. Bunlardan en önemlisi eşik değerinin seçilmesindeki belirsizliktir. Görüntünün farklı bölümleri için genellikle önemli ölçüde farklı eşik değerleri ile kabul edilebilir bir sonuç elde edilir. Ayrıca fark filtreleri görüntü gürültüsüne karşı çok duyarlıdır.

İki boyutlu döngüsel evrişim. Tek boyutlu sinyallerde olduğu gibi, hızlı Fourier dönüşümü algoritmaları kullanılarak ve görüntünün ve filtre çekirdeğinin iki boyutlu spektrumları çarpılarak uzamsal frekans alanında iki boyutlu evrişim gerçekleştirilebilir. Aynı zamanda döngüseldir ve genellikle kayan bir versiyonda gerçekleştirilir. Döngüselliği hesaba katarak, çekirdek spektrumunun sabit bir modelini hesaplamak için, çekirdek filtre maskesinin boyutları eksenler boyunca iki katına çıkarılır ve sıfırlarla doldurulur ve aynı maske boyutları, görüntü boyunca kayan bir pencere seçmek için kullanılır. FFT gerçekleştirilir. FFT kullanarak bir FIR filtresi uygulamak, özellikle filtrenin geniş bir referans alanına sahip olması durumunda etkilidir.

Doğrusal olmayan filtreler . Dijital görüntü işlemede, çeşitli gürültü modellerinden zarar gören görüntülerin onarılmasında, sıra istatistiklerine dayalı doğrusal olmayan algoritmalar yaygın olarak kullanılmaktadır. Gürültüyü giderirken ek görüntü bozulmasını önlemenize ve ayrıca yüksek derecede gürültüye sahip görüntülerdeki filtrelerin sonuçlarını önemli ölçüde iyileştirmenize olanak tanır.

Bu komşuluğun merkezi olan A(x, y) görüntü elemanının M-komşuluğu kavramını tanıtalım. En basit durumda, M-komşusu N-piksel içerir; bunlar, merkezi olan da dahil (veya dahil olmayan) filtre maskesine düşen noktalardır. Bu N elemanlarının değerleri, artan (veya azalan) sırada sıralanan bir V(r) varyasyon serisinde düzenlenebilir ve bu serinin belirli anları, örneğin ortalama parlaklık değeri mN ve hesaplanabilir. varyans dN. Merkezi numunenin yerini alan filtrenin çıkış değeri aşağıdaki formül kullanılarak hesaplanır:

B(x, y) = aA(x, y) + (1-a)mN. (17.3.2)

a = katsayısının değeri, filtre penceresindeki örneklerin istatistiklerine belirli bir bağımlılıkla ilişkilidir, örneğin:

a = dN /(dN + k dS), (17.3.3)

burada dS, S > M ve MÎS için bir bütün olarak görüntü üzerindeki veya S-komşuluğu üzerindeki gürültü dağılımıdır; k, S-komşuluklarının dağılımı için güven sabitidir. Bu formülden de anlaşılacağı üzere k = 1 ve dN » dS a » 0,5 için B(x, y) = (A(x, y) + mN)/2 değeri yani toplamları eşit olur. merkezi numunenin değerleri ve M-mahallesinin piksellerinin ortalama değeri. DN değerleri arttıkça merkezi referans değerinin sonucuna katkısı artar, dN değerleri azaldıkça mN değeri artar. M-komşuluğundaki ortalama değerlerin katkısının ağırlığı, k katsayısının değeri ile değiştirilebilir.

İstatistiksel fonksiyonun seçimi ve a katsayısının buna bağımlılığının doğası oldukça çeşitli olabilir (örneğin, M-mahallesindeki örneklerdeki farklılıkların merkezi bir örnekle dağılımına göre) ve her ikisinin de boyutuna bağlıdır filtre açıklığının ve görüntülerin ve gürültünün doğasına bağlıdır. Temel olarak, a katsayısının değeri, merkezi numunedeki hasarın derecesini ve buna bağlı olarak M-mahallesinden numunelerin düzeltilmesi için borçlanma fonksiyonunu belirtmelidir.

Görüntü işleme için en basit ve en yaygın doğrusal olmayan filtre türleri eşik ve medyan filtreleridir.

Eşik filtreleme örneğin şu şekilde verilir:

B(x, y) =

Büyüklük P filtreleme eşiğidir. Filtrenin merkez noktasının değeri, M-komşuluğundaki mN örneklerinin ortalama değerini eşik değeri kadar aşarsa, bu durumda ortalama değer ile değiştirilir. Eşik değeri ya sabit olabilir ya da işlevsel olarak merkezi noktanın değerine bağlı olabilir.

Medyan filtreleme şu şekilde tanımlanır:

B(x, y) = ortad (M(x, y)),

yani filtreleme sonucu, şekli filtre maskesi tarafından belirlenen mahalle piksellerinin medyan değeridir. Medyan filtreleme, bir görüntüdeki tek tek pikselleri bağımsız olarak etkileyen gürültüyü etkili bir şekilde ortadan kaldırabilir. Örneğin, bu tür girişimler, dijital fotoğrafçılık sırasında "ölü" pikseller, bazı piksellerin yerini maksimum yoğunluğa sahip pikseller aldığında "kar" gürültüsü vb.'dir. Medyan filtrelemenin avantajı, karanlık bir arka plan üzerindeki "sıcak" bir pikselin yerini almasıdır. karanlık ve alanın etrafında "lekeli" değil.

Medyan filtreleme, filtre açıklığı içindeki sayı dizisinin monoton olmayan bir bileşeni olan dizi elemanlarına göre belirgin bir seçiciliğe sahiptir. Aynı zamanda medyan filtresi dizinin monoton bileşenini değiştirmeden bırakır. Bu özellik sayesinde, en iyi şekilde seçilen diyafram açıklığına sahip medyan filtreler, keskin nesne sınırlarını bozulma olmadan korur, ilişkisiz veya zayıf ilişkili gürültüyü ve küçük boyutlu ayrıntıları bastırır.

Ekstrem filtreler kurallara göre belirlenir:

Bmin(x, y) = dk (M(x, y)),

Bmax(x, y) = maksimum (M(x, y)),

yani filtreleme sonucu minimumdur ve maksimum değer filtre maskesindeki pikseller. Bu tür filtreler genellikle ikili görüntüler için kullanılır.

17.4. GÖRÜNTÜ SIKIŞTIRMA

Renkli iletim için piksel başına 24 bit ve yaklaşık 3000x2000 çözünürlüğe sahip tipik bir görüntünün hacmi 17 megabayttır. Profesyonel cihazlar için, ortaya çıkan görüntü taramasının boyutu çok daha büyük olabilir, renk derinliği piksel başına 48 bit'e kadar çıkabilir ve bir görüntünün boyutu 200 megabayttan fazla olabilir. Bu nedenle, görüntü sıkıştırma algoritmaları, bir görüntüyü temsil eden veri miktarını azaltmak açısından oldukça önemlidir.

İki ana algoritma sınıfı vardır:

1. Kayıpsız sıkıştırma A (kayıpsız sıkıştırma), eğer varsa ters algoritma A-1, herhangi bir h - görüntüsü için A[h] = h1, A-1 = h'ye sahibiz. Kayıpsız sıkıştırma bu tür durumlarda kullanılır grafik formatları GIF, PCX, PNG, TGA, TIFF gibi görüntü gösterimleri ve en ufak bir bozulmanın bile istenmediği durumlarda özellikle değerli birincil bilgilerin (tıbbi görüntüler, hava ve uzay fotoğrafları vb.) işlenmesinde kullanılır.

2. Orijinal görüntüyü doğru bir şekilde geri yükleme yeteneği sağlamıyorsa, kayıplı sıkıştırma. A ile eşleştirilen yaklaşık görüntü restorasyon algoritması A* olarak gösterilecektir. (A, A*) çifti, görsel kaliteyi korurken yüksek sıkıştırma oranları sağlayacak şekilde seçilir. Kayıplı sıkıştırma görüntü formatlarında kullanılır: JPEG, JPEG2000, vb.

Tüm algoritmalar ve ifadeler, öğeleri sonlu sayıda değer alabilen hem görüntülere hem de rastgele dizilere uygulanır. Herhangi bir veri setini kayıpsız sıkıştırabilecek ideal bir algoritmanın olmadığı unutulmamalıdır.

Tekrar Uzunluğu Kodlama (RLE) Algoritmaları dayanmaktadır basit prensip: Orijinal dizinin tekrarlanan eleman gruplarının bir çiftle (miktar, eleman) veya yalnızca miktarla değiştirilmesi.

Bit seviyesi. Kaynak verilerini, örneğin siyah beyaz bir görüntüyü temsil eden bir bit dizisi düzeyinde ele alacağız. Genellikle bir satırda birkaç 0 veya 1 bulunur ve bir satırdaki aynı rakamların sayısını kodlayabilirsiniz. Ancak tekrarların sayısı da bit cinsinden kodlanmalıdır. Her tekrar sayısının 0'dan 7'ye (3 bitlik kod) değiştiğini, birler ve sıfırlardan oluşan bir kod dizisinin değiştiğini düşünebiliriz. Örneğin, diziler 7 0 4 sayılarıyla karşılaştırılabilir, yani 7 bir, 0 sıfır, 4 bir ve yeni bir yılımız var - Aynı bit dizilerinin uzunluğu ne kadar uzun olursa, etki o kadar büyük olur. Böylece, 21 bir, 21 sıfır, 3 bir ve 7 sıfırdan oluşan bir dizi şu şekilde kodlanacaktır: yani, 51 bit uzunluğundaki orijinal diziden 36 bit uzunluğunda bir diziye sahibiz.

Bayt seviyesi. Girişin, piksel yoğunluğu değeri için 1 baytın tahsis edildiği bir yarı tonlu görüntü olduğunu ve aynı bitlerden oluşan uzun bir zincir beklentisinin önemli ölçüde azaldığını varsayalım.

Giriş akışını baytlara (0'dan 255'e kadar kod) böleceğiz ve tekrarlayan baytları bir çiftle (miktar, harf) kodlayacağız. Tek bir bayt değişmeden bırakılabilir. Yani baytları AABBBCDAA (2A) (3B) (C) (D) (2A) olarak kodluyoruz.

Bununla birlikte, algoritmanın etkili olduğu dizilerin alt sınıfı nispeten dar olduğundan, bu algoritmanın modifikasyonları nadiren kendi başına kullanılır (örneğin PCX formatında). Daha sıklıkla sıkıştırma boru hattının aşamalarından biri olarak kullanılırlar.

Sözlük algoritmaları Gelen dizinin yalnızca bir öğesini kodlamak yerine bir öğeler zinciri kodlanır. Bu durumda, yenilerini kodlamak için bir zincir sözlüğü (giriş dizisinden oluşturulan) kullanılır.

LZ77 algoritması sözlük kullanan ilk algoritmalardan biriydi. Dizinin halihazırda kodlanmış son N öğesi bir sözlük olarak kullanılır. Sıkıştırma işlemi sırasında, alt dizi sözlüğü giriş dizisi boyunca "kayar". Çıktıdaki öğe zinciri şu şekilde kodlanır: işlenmiş öğe zincirinin eşleşen kısmının sözlükteki konumu - ofset (geçerli konuma göre), uzunluk, zincirin eşleşen kısmını takip eden ilk öğe. Eşleşen zincirin uzunluğu yukarıda n sayısıyla sınırlıdır. Buna göre görev, işlenen diziyle eşleşen sözlükten en büyük zinciri bulmaktır. Eşleşme yoksa sıfır ofseti, birim uzunluk ve kodlanmamış dizinin ilk öğesi kaydedilir.

Yukarıda açıklanan kodlama şeması, iki bölümden oluşan sürgülü pencere konseptine yol açmaktadır:

N-sözlük uzunluğundaki zaten kodlanmış öğelerin bir alt dizisi - arama arabelleği;

Bir eşleşme bulma girişiminde bulunulacak bir öğe zincirinden n uzunluğunda bir alt dizi - bir tampon Ön izleme(ileriye dönük arabellek).

Sıkıştırılmış bir dizinin kodunun çözülmesi, kaydedilen kodların kodunun çözülmesidir: her kayıt, sözlükteki bir zincirle ve açıkça yazılmış bir öğeyle eşleştirilir ve ardından sözlük kaydırılır. Kod çözme algoritması çalışırken sözlük yeniden oluşturulur.

Bu algoritma bütün bir algoritma ailesinin kurucusudur. Avantajları arasında oldukça büyük dizilerde iyi derecede sıkıştırma ve hızlı açma bulunur. Dezavantajları ise, alternatif algoritmalara göre yavaş sıkıştırma hızı ve daha düşük sıkıştırma oranıdır.

LZW algoritması. Sözlük girişi bu algoritma Algoritma çalışırken öğe zincirleriyle doldurulan bir tablodur. Sıkıştırma işlemi sırasında sözlükte kayıtlı olan en uzun zincir bulunur. Sözlükte yeni bir öğe zinciri bulunmadığında sözlüğe eklenir ve zincir kodu kaydedilir. Teorik olarak, tablonun boyutunda herhangi bir kısıtlama yoktur, ancak gereksiz (oluşmayan) zincirler biriktiği için boyutu sınırlamak sıkıştırma oranını iyileştirmenize olanak tanır. Bir tabloda ne kadar çok giriş varsa, mağaza kodlarına o kadar fazla bilgi tahsis edilmesi gerekir.

Kod çözme, kodların doğrudan deşifre edilmesinden, yani bir sözlük oluşturulmasından ve karşılık gelen zincirlerin çıktısından oluşur. Sözlük, kodlayıcıdakiyle aynı şekilde başlatılır. Algoritmanın avantajları arasında yüksek derecede sıkıştırma ve oldukça yüksek hem sıkıştırma hem de kod çözme hızı yer alır.

İstatistiksel kodlama algoritmaları Dizinin her bir elemanına, uzunluğu elemanın oluşma olasılığına karşılık gelecek şekilde bir kod atayın. Sıkıştırma, orijinal dizinin aynı uzunluğa sahip öğelerinin (her öğe aynı sayıda biti kaplar) farklı uzunluktaki öğelerle, olasılığın negatif logaritmasıyla orantılı olarak değiştirilmesiyle oluşur; yani diğerlerinden daha sık meydana gelen öğelerin bir kodu vardır. daha kısa uzunlukta.

Huffman'ın algoritması, özel bir özelliğe sahip değişken uzunluklu bir önek kodu kullanır: daha kısa kodlar, daha uzun olanların önekiyle (başlangıç kısmı) eşleşmez. Bu kod birebir kodlamaya olanak sağlar. Sıkıştırma işlemi, giriş dizisinin her öğesinin kendi koduyla değiştirilmesini içerir. Bir dizi kodun oluşturulması genellikle sözde kullanılarak gerçekleştirilir. kod ağaçları.

Huffman algoritması iki geçişli bir algoritmadır. Görüntüden ilk geçişte öğe ağırlıklarının bir tablosu oluşturulur ve ikinci geçişte kodlama gerçekleşir. Algoritmanın sabit tablolu uygulamaları vardır. Çoğu zaman, alfabenin öğelerinin önsel olasılık dağılımının bilinmemesi, çünkü tüm dizi aynı anda mevcut değildir ve Huffman algoritmasının uyarlanabilir modifikasyonları kullanılır.

Kayıplı görüntü sıkıştırma. Görüntüleri saklamak için gereken bilgi miktarı genellikle büyüktür. Genel amaçlı algoritmalar olan klasik algoritmalar, sıkıştırılmış bilginin bir görüntü - iki boyutlu bir nesne olduğunu dikkate almaz ve yeterli derecede sıkıştırma sağlamaz.

Kayıplı sıkıştırma, insan görüntü algısının özelliklerine dayanır: belirli bir renk dalgası aralığında en yüksek hassasiyet, küçük bozulmaları fark etmeden görüntüyü bir bütün olarak algılama yeteneği. Kayıplı sıkıştırma algoritmalarının hedeflediği ana görüntü sınıfı, yumuşak renk geçişlerine sahip fotoğraflar ve görüntülerdir.

Görüntülerdeki kaybın tahmini. Sıkıştırılmış olanlardan geri yüklendikten (şifresi çözüldükten) sonra görüntülerdeki kayıpları değerlendirmek için birçok önlem vardır, ancak bunların hepsi için, fark ölçüleri oldukça büyük olacak şekilde iki görüntü seçmek mümkündür, ancak farklar neredeyse görünmez olacaktır. göze. Ve bunun tersi de geçerlidir; gözle çok farklı görünen, ancak küçük bir fark ölçüsüne sahip olan görüntüleri seçebilirsiniz.

Standart bir sayısal kayıp ölçüsü genellikle yeniden oluşturulan görüntünün piksel değerlerinin orijinalinden standart sapmasıdır (RMS). Ancak kayıp değerlendirmesinin en önemli "ölçüsü" gözlemcinin görüşüdür. Bir gözlemci ne kadar az fark tespit ederse (veya daha iyisi hiçbir fark yoksa), sıkıştırma algoritmasının kalitesi o kadar yüksek olur. Kayıplı sıkıştırma algoritmaları genellikle kullanıcıya "kaybedilen" veri miktarını seçme olanağı verir, yani kalite ve boyut arasında seçim yapma hakkı verir. sıkıştırılmış görüntü. Doğal olarak daha iyi görsel kalite Sıkıştırma oranı ne kadar yüksek olursa algoritma o kadar iyi olur.

Fourier dönüşümü. Genel olarak bir görüntü, son taramanın noktalarında tanımlanan iki değişkenin bir fonksiyonu olarak görülebilir. Sabit bir sonlu taramanın noktalarındaki bu tür işlevler kümesi, sonlu boyutlu bir Öklid uzayı oluşturur ve ayrı bir Fourier dönüşümü, yani görüntünün spektral bir temsili bunlara uygulanabilir. Şunları sağlar:

İlişkisiz ve bağımsız spektrum katsayıları, yani bir katsayının temsilinin doğruluğu diğerine bağlı değildir.

- Enerji sıkıştırması. Dönüşüm, temel bilgileri az sayıda katsayıda saklar. Bu mülk Bu etki en çok fotogerçekçi görüntülerde belirgindir.

Spektral temsil katsayıları görüntünün uzaysal frekanslarının genlikleridir. Yumuşak geçişli görüntülerde bilginin çoğu düşük frekans spektrumunda bulunur.

Kullanılan sıkıştırma algoritması JPEG formatı, ayrık kosinüs Fourier dönüşümünün kullanımı üzerine kurulmuştur. Algoritmadaki sıkıştırma şeması, bu dönüşümün yalnızca aşamalardan biri olduğu, ancak ana aşamalardan biri olduğu bir boru hattıdır. Algoritma aşağıdaki ana işlemleri içerir:

1. YCbCr renk uzayına dönüştürme. Burada Y parlaklık bileşeni, Cb ve Cr ise renklilik bileşenleridir. İnsan gözü, renkten ziyade parlaklığa daha duyarlıdır. Bu nedenle Y'yi aktarırken Cb ve Cr'yi aktarırken daha fazla doğruluk sağlamak daha önemlidir.

2. Ayrık kosinüs dönüşümü (DCT). Görüntü 8x8 bloğa bölünür ve her bloğa ayrı bir kosinüs dönüşümü uygulanır (Y, Cb ve Cr bileşenleri için ayrı ayrı).

3. DCT matrislerinde yüksek frekanslı bileşenlerin azaltılması. İnsan gözü yüksek frekanslı bileşenlerdeki değişiklikleri neredeyse hiç fark etmez, bu nedenle yüksek frekanslardan sorumlu katsayılar daha az doğrulukla saklanabilir.

4. Matrislerin zikzak sıralaması. Bu, tek boyutlu bir dizi elde etmek için özel bir matris geçişidir. Önce T00 öğesi, ardından T01, T10, T1 gelir. Ayrıca, tipik fotogerçekçi görüntüler için, önce düşük frekanslı bileşenlere karşılık gelen sıfır olmayan katsayılar ve ardından bir dizi sıfır (yüksek frekanslı bileşenler) olacaktır.

5. Önce sıkıştırın RLE yöntemi ve daha sonra Huffman yöntemiyle.

Görüntü restorasyon algoritması şu şekilde çalışır: Ters sipariş. Sıkıştırma oranı 5 ila 100 kat veya daha fazladır. Aynı zamanda çoğu fotogerçekçi görüntünün görsel kalitesi aynı kalır. Iyi seviye 15 kata kadar sıkıştırıldığında. Algoritma ve format, tam renkli görüntülerin iletilmesi ve saklanması için en yaygın olanlardır.

Dalgacık dönüşümü sinyaller klasik Fourier dönüşümünün bir genellemesidir. İngilizce'den tercüme edilen "dalgacık" terimi "küçük (kısa) dalga" anlamına gelir. Dalgacıklar ailelere verilen genelleştirilmiş bir isimdir. matematiksel fonksiyonlar zaman ve frekans açısından yerel olan ve tüm fonksiyonların zaman ekseni boyunca kaymaları ve uzanmaları yoluyla tek bir temelden elde edildiği belirli bir form.

Kayıplı sıkıştırma algoritmalarında, kural olarak, sıkıştırma hattının tüm işlemleri korunur ve ayrık Fourier dönüşümü, ayrık dalgacık dönüşümüyle değiştirilir. Dalgacık dönüşümleri çok iyi frekans-uzaysal lokalizasyona sahiptir ve bu bakımdan geleneksel Fourier dönüşümlerinden üstündür. Bu durumda, daha sonraki sıkıştırma için dizinin özelliklerini geliştirerek daha güçlü nicemleme uygulamak mümkün hale gelir. Bu dönüşümü temel alan görüntü sıkıştırma algoritmaları, aynı sıkıştırma oranında şunu gösterir: En iyi skorlar Görüntü kalitesini korumak için.

edebiyat

46. ve diğerleri. Dijital görüntü işlemede hızlı algoritmalar. – M.: Radyo ve İletişim, 1984. – 224 s.

47. Soifer görüntü işleme. Bölüm 2. Yöntemler ve algoritmalar. – Soros eğitim dergisi No. 3, 1996.

48. , Sıralama istatistiklerini kullanan doğrusal olmayan algoritmalara dayalı görüntülerden elde edilen kartuş gürültüsü. - Yaroslavl Devlet Üniversitesi, 2007.

49. Andreev televizyon gözetim sistemleri. Bölüm II. Aritmetik ve mantıksal temeller ve algoritmalar. öğretici. - St. Petersburg: St. Petersburg, GUITMO, 2005. – 88 s.

51. Dijital sinyal işlemeye giriş (Matematiksel temeller). - M.: Moskova Devlet Üniversitesi, Bilgisayar Grafikleri ve Multimedya Laboratuvarı, 2002. - http://pv. *****/dsp/dspcourse.dll pdf, http://dsp-kitap. *****/dspkurs. djvu, http://geogin. *****/arhiv/dsp/dsp4.pdf.

1i. ve diğerleri. Raster grafiklerin algoritmik temelleri. – İnternet Bilgi Teknolojileri Üniversitesi. – http://www. *****/goto/kurs/rastrgraph/

2i. Lukin -elektronik sistemler: Ders Notları. ITMO, 2004. - St. Petersburg, ITMO IFF, 2004. - http://iff. *****/kons/oes/KL. htm

Fark edilen hatalar ve ekleme önerileri hakkında: *****@***ru.

Bu makale, bulanık mantığa dayalı akıllı mobil robotlar tarafından görüntü işleme için algoritmalar geliştiriyor ve nöral ağlar Sobel operatörünü kullanarak görüntüdeki sınırların vurgulanmasını sağlar. Görüntü işlemenin özü, bir sahnenin orijinal görüntüsünü, nesnelerini tanıma problemini çözebilecek bir forma indirgemektir. Bir görüntünün tanınma için ilk hazırlığı sırasında ana sorunların yanı sıra bunları çözme yolları da dikkate alınır. Bulanık mantık kullanan ön işleme algoritması ve görüntü ikilileştirme süreci ayrıntılı olarak analiz edilmiştir. Sobel operatörünü kullanarak bir görüntüdeki sınırları tanımlamak için bulanık bir işleme algoritması oluşturulmuştur.

görüntü işleme

Bulanık mantık

akıllı sistem

nesne tanıma

1. Vesnin E.N., Veto A.V., Tsarev V.A. Uyarlanabilir optoelektronik görüş sistemlerinin geliştirilmesi ve uygulanması konusunda // Endüstride otomasyon, 2009.- No. 11.- S. 48-52.

2. Grishin V.A. İnsansız hava araçlarının kontrol problemlerinin çözümünde teknik görüş sistemleri // Sensörler ve Sistemler, Sayı 2, 2009.- S. 46-52.

3. Klevalin V.A., Polivanov A.Yu. Endüstriyel robotların teknik görüş sistemlerinde dijital tanıma yöntemleri // Mekatronik, otomasyon, kontrol, 2008, Sayı. 5.- S. 56-56.

4. Mikhailov S.V., Romanov V.V., Zaikin D.A. Malzemelerin kesilmesi işleminin teşhisi için teknik görüş sistemi // Bilgisayar bülteni ve Bilişim Teknolojileri, 2007, Sayı. 3.- S. 12-19.

5. Semin M.S. Teknik görüş sistemlerini kullanarak uygulamalı sorunları çözmenin gözden geçirilmesi// http://www.videoscan.ru/page/718#13.

Otomatik görüntü işleme şu anda alanın en önemli alanlarından biridir. yapay zeka ve görüntü tanımayı gerçekleştiren robotik sistemlerin geliştirilmesini içerir. En iyilerinden biri etkili araçlarÖrüntü tanıma için bulanık mantık ve yapay sinir ağları üzerine kurulu sistemlerdir. Teknik görüş sistemi (TVS), aynı sorunu çözen çeşitli yöntem ve algoritmalar gerektirir. Farklı yollar Tanımlamanın hızı ve güvenilirliği için gerekli göstergeleri sağlarken.

Mobil robotik sistemlerin (MRC) SZ'sindeki hibrit görüntü işleme algoritmasının özü, sahnenin orijinal görüntüsünü, nesnelerini tanıma problemini çözmeye olanak tanıyan bir forma indirgemektir.

STS'de bulanık bir sistem kullanarak görüntü ön işleme algoritması

Görüntü işlemede bulanık işleme, anlama, temsil etme, görüntü işleme, bölütleme ve bulanık kümeler gibi birçok farklı bulanık yaklaşımı temsil eder. Örüntü tanıma sürecinde, sinir ağının girişlerine giren verilerin kalitesi buna bağlı olduğundan, ön bulanık görüntü işleme süreci büyük önem taşımaktadır. Çözülen problem çerçevesinde, geliştirilen bulanıklık öncesi işleme algoritması aşağıdaki adım dizisiyle temsil edilebilir (Şekil 1): bir web kamerası kullanılarak görüntü yakalama; elde edilen renkli görüntünün gri tonlamalı bir görüntüye dönüştürülmesi; bulanık görüntü işleme.

Pirinç. 1. Ön bulanık görüntü işleme algoritması

Bu nedenle ön bulanık işlemenin ilk adımı görüntüyü renkliden gri tonlamaya dönüştürmektir. Görüntü renklerinin gri tonlamaya dönüştürülmesi aşağıdaki şekilde yapılır. Renk paletinin tamamı, köşeleri farklı renklere karşılık gelen bir küp biçiminde temsil edilir. Gri tonlama, siyah ve beyaz köşeleri birleştiren küpün köşegeninde bulunur.

Bir görüntüyü gri tonlarına dönüştürmek için, rengin kırmızı, yeşil ve mavi bileşenlerinin yoğunlukları görüntüdeki her nokta için izole edilir ve ardından renk, aşağıdaki formül kullanılarak dönüştürülür:

yeni renk değeri nerede, rengin kırmızı bileşeninin yoğunluğu, rengin yeşil bileşeninin yoğunluğu ve rengin mavi bileşeninin yoğunluğu. Her algoritmanın çıktısı 0 ile 1 arasında gri tonlamalıdır. Görüntüleri yalnızca gri tonlamalı görüntülere dönüştürmek için bazı teknikler mevcuttur. Açıklık yöntemi, en çok ve en az anlamlı iki renk arasındaki ortalama değeri kullanır: . Ortalama yöntemi tüm değerlerin ortalamasını kullanır. üç renk: . Parlaklık yöntemi, insan algısını hesaba katmak için üç rengin ağırlıklı ortalamasını kullanır. Dolayısıyla insan gözü en çok yeşil renge duyarlı olduğundan ağırlığı en önemli renk olarak kabul edilir: . Kullanılan parlaklık algılama yöntemi yazılım görüntü işleme için. İşlevi uyguladı" MATLAB'da "rgb2gray" bulunur ve genellikle bilgisayarlı görme için kullanılır. Bulanık ön işleme, parlaklık algılama yöntemini kullanarak görüntüleri renkliden (RGB) gri tonlamaya dönüştürme işlemine sahiptir. Daha sonra görüntü gri tonlamadan siyah beyaza dönüştürülür (Şekil 2).

Pirinç. 2. görüntüleri renkliden gri tonlamaya dönüştürme işlemi

Ön işleme sırasında görüntü ikilileştirme

Ön bulanık görüntü işlemenin amacı, görüntünün oluşturulması ve ardından iyileştirilmesi, ikilileştirilmesi ve kodlanmasıdır (özellikle bir kontur gösteriminin elde edilmesi). Görüntü ikilileştirme, bir rengin (bizim durumumuzda gri) derecelendirilmesinden oluşan bir görüntüyü ikili görüntüye dönüştürme işlemidir; her pikselin yalnızca iki renge sahip olabildiği bir görüntü (bizim durumumuzda siyah ve beyaz). Bu dönüşümün bir sonucu olarak, pikselin rengi geleneksel olarak sıfır veya bire eşit kabul edilirken, sıfır değerli piksellere (bu durumda bunlar beyaz piksellerdir) arka plan ve değeri bire eşit olan pikseller denir. (siyah) ön plan olarak adlandırılır. Ancak böyle bir dönüşüm sonucunda elde edilen ikili görüntü, nesnelerde kırılma ve bulanıklığın ortaya çıkması, homojen alanlarda görüntü gürültüsünün ortaya çıkması ve bütünlüğün kaybı ile karakterize edilen orijinal ile karşılaştırıldığında bozulmaktadır. nesnelerin yapısından kaynaklanır.

Nesne bütünlüğünün kaybı ve nesnenin yırtılması, nesnenin büyük ölçüde eşit olmayan şekilde aydınlatılması veya dokunma (veya nesnelerin üst üste binmesi) gibi çeşitli nedenlerden dolayı meydana gelir. İşlemede özellikle zorluğa neden olan şey, kaplamadır (veya kaplamanın özel bir durumu olarak dokunmaktır), çünkü bir yandan birden fazla nesnenin görüntüsü tek bir nesne olarak yorumlanabilecekken, diğer yandan nesnenin geometrik bütünlüğünü kontrol eden algoritmalar çakışma yerlerinde süreksizlikler oluşturarak bu alanları arka plan olarak sunacaktır. İşlemenin zorluğu, bilgilerin bir kısmı kaybolduğu için nesnelerin üst üste binmesini yorumlama sorununa teorik bir çözüm bulunmamasından kaynaklanmaktadır. Algoritmaları pratikte uygularken aşağıdakilerden biri doğru karar olarak alınır. yukarıdaki seçenekler- ya kesişim mevcut nesnenin devamı olarak kabul edilir ya da örtüşen alan arka plan olarak kabul edilir.

Eşikleme, renkli veya gri bir görüntüyü siyah beyaz bir görüntüye dönüştürür. Eşik dönüşümleri, sezgisel özellikleri ve uygulama kolaylığı nedeniyle uygulamalı görüntü bölütleme problemlerinde merkezi bir yer tutar. Görüntüdeki her pikselin yoğunluk düzeyi incelenir; değeri belirli bir eşik düzeyinin üzerindeyse beyaz renge karşılık gelir. Ayarlanan eşiğin altındaysa siyaha ayarlanır. Eşik seviyesi 0 ile 255 arasında olacaktır.

Şu anda çok sayıda ikilileştirme yöntemi vardır. Bu taramalı görüntü dönüştürmenin özü, Karşılaştırmalı analiz belirli bir eşik değeri ile mevcut pikselin parlaklığı: mevcut pikselin parlaklığı eşik değerini aşarsa, örn. ise ikili görüntüdeki piksel rengi beyaz, aksi halde renk siyah olacaktır. Eşik yüzeyi, boyutu orijinal görüntünün boyutuna karşılık gelen bir matristir.

İkilileştirme sürecinde, tüm yöntemler bir eşik yüzeyi oluşturma ilkesine göre iki gruba ayrılır - bunlar, ikilileştirmenin küresel ve yerel olarak işlenmesi yöntemleridir. Küresel ikilileştirme işleme yöntemlerinde eşik yüzeyi, sabit bir eşik parlaklık değerine sahip bir düzlemdir; eşik değeri tüm görüntünün histogramının analizine dayalı olarak hesaplanır ve orijinal görüntünün tüm pikselleri için aynıdır. Küresel eşiklemenin önemli bir dezavantajı vardır; kaynak görüntü eşit olmayan bir aydınlatmaya sahipse, daha az aydınlatılan alanlar tamamen ön plan olarak sınıflandırılır. Yerel ikilileştirme işleme yöntemlerinde eşik değeri, her nokta için o noktanın belirli bir mahallesine ait alanın bazı özelliklerine göre değişir. Bu tür dönüşümün dezavantajı düşük hız her görüntü noktası için eşik değerlerinin yeniden hesaplanmasıyla ilgili algoritmaların çalışması.

Sorunun çözümü için bir yöntem olarak Bernsen yöntemini kullanacağız. Yöntem, dönüştürülen pikselin parlaklık düzeyinin, kendi ortamında hesaplanan yerel ortalama değerleriyle karşılaştırılması fikrine dayanmaktadır. Nokta merkezli pencerelerde yoğunlukları ortalama parlaklık değerleriyle karşılaştırılarak görüntü pikselleri tek tek işlenir (Şekil 3).

Pirinç. 3. Görüntü Piksel Dönüşümü

Kenar tespiti ve görüntü segmentasyonu için bulanık işleme algoritması

Görüntü siyah beyaza dönüştürüldükten sonra Sobel operatörü kullanılarak bir gradyan görüntüsü elde edilir ve bulanık görüntü işlemenin (FIP) girişlerine beslenir (Şekil 4).

Bulanık görüntü işleme üç ana aşamadan oluşur: görüntü bulanıklaştırma, üyelik değerlerine ilişkin bulanık çıkarım sistemi ve görüntü durulaştırma. Ana bulanık görüntü işleme orta adımdadır (bulanık çıkarım sistemi). Görüntü verisi gri seviyeden bulanıklaştırmaya geçirildikten sonra üyelik değerlerine göre bulanık çıkarım sistemi belirlenir. Bulanıklaştırma, görüntü verilerinin kodlanması, durulaştırma ise sonuçların kodunun çözülmesi olup, bulanık tekniklerle görüntü işlemeye olanak sağlar.

Resim - gri düzeyli boyut ve görüntünün ön özelliklerine göre (örn. parlaklık, pürüzsüzlük, vb.) her pikselin üyelik değerini gösteren bulanık tek noktalı kümelerin (bulanık kümeler yalnızca bir noktayla desteklenebilir) bir dizisi olarak tanımlanabilir.

(1)

Bulanık kümelerin gösterimindeki piksel üyelikleri nerede ve nelerdir? Üyelik değerlerinin belirlenmesi, belirli uygulamanın özel gereksinimlerine ve ilgili bilgi tabanına bağlıdır.

Giriş sistemi için sistem çıkışı aşağıdaki formülle verilir:

(2)

Pirinç. 4. Kenar tespiti için bulanık görüntü işleme algoritması

Örüntü tanıma için sinir ağlarının uygulanması

Çok katmanlı bir algılayıcı, bir giriş katmanını oluşturan birkaç giriş düğümünden, bir veya daha fazla hesaplama nöron katmanından ve bir çıkış katmanından oluşan yapay bir sinir ağıdır (Şekil 6). Bu tür ağlarda giriş katmanına uygulanan sinyal ileri yönde katmandan katmana sıralı olarak iletilir. Bu tip YSA, özellikle örüntü tanıma problemi olmak üzere çeşitli problemleri çözmek için başarıyla kullanılmıştır.

Bir geri yayılımlı sinir ağı, bir önceki katmandaki her bir nöronun bir sonraki katmandaki her bir nörona bağlandığı birkaç nöron katmanından oluşur. Bu tür ağlarda katman sayısı ve her katmanın eleman sayısı belirlendikten sonra ağın ağırlık ve eşik değerlerinin tahmin hatasını en aza indirecek şekilde hesaplanması gerekir. Bu görevçeşitli öğrenme algoritmaları kullanılarak çözülür. Bu algoritmaların özü, ağı eğitim verilerine uygun hale getirmektir. Uygulanan ağın hatası, tüm giriş verilerinin çalıştırılması ve ağ çıkışında elde edilen gerçek değerlerin hedef değerlerle karşılaştırılması yoluyla belirlenecektir. Daha sonra ortaya çıkan farklar, hata fonksiyonunu karakterize eden ortak bir fonksiyonda toplanır. Genel hata ağlar. Ancak daha sıklıkla hataların karelerinin toplamı hataların bir fonksiyonu olarak alınır.

Çok katmanlı sinir ağlarını eğitmek için en yaygın algoritmalardan biri geri yayılım algoritmasıdır. Bu algoritma hata yüzeyinin gradyan vektörünü hesaplar. Daha sonra vektör yönünde belirli bir miktar hareket ederiz (bu bize en dik inişin yönünü gösterecektir), burada hata değeri daha küçük olacaktır. Böyle tutarlı bir ilerleme, yavaş yavaş hatanın en aza indirilmesine yol açacaktır. Burada avans verilecek miktarın belirlenmesinde zorluk ortaya çıkıyor. Adım boyutu nispeten büyükse, bu en hızlı inişe yol açacaktır, ancak "üstünden atlama" olasılığı da vardır

Yüzey oldukça karmaşık bir şekle sahipse istenen noktaya gelin veya yanlış yöne gidin. Örneğin, yüzey dik eğimli dar bir vadi ise, algoritma bir eğimden diğerine atlayarak çok yavaş hareket edecektir. Adım boyutu küçükse bu, en uygun yönün bulunmasına yol açacaktır ancak yineleme sayısını önemli ölçüde artırabilir. En iyi sonucu elde etmek için adım boyutu, belirli bir sabit olan öğrenme oranı ile eğimin dikliği ile orantılı olarak alınır. Bu sabitin seçimi deneysel olarak gerçekleştirilir ve belirli bir problemin koşullarına bağlıdır.

Aşağıdaki gösterimi tanıtalım. Girişlerden gizli katmana kadar olan ağırlıklandırma katsayıları matrisini ve gizli ve çıkış katmanlarını birbirine bağlayan ağırlıklar matrisini - gösterelim. İndeksler için şu gösterimi kullanacağız: girdiler yalnızca indekse göre, gizli katmanın elemanları indekse göre ve çıktılar indekse göre numaralandırılacaktır. Ağ giriş sayısı, gizli katmandaki nöron sayısı, çıkış katmanındaki nöron sayısıdır. Ağın bir örnek üzerinde eğitilmesine izin verin. Daha sonra çok katmanlı algılayıcı eğitim algoritması şöyle görünecektir:

Adım 1. Ağın başlatılması. Ağırlıklandırma katsayılarına, örneğin (-0,3, 0,3) aralığında küçük rastgele değerler atanır; - öğrenme doğruluğu parametresi, - öğrenme hızı parametresi (kural olarak ve öğrenme süreci sırasında daha da düşebilir), - izin verilen maksimum yineleme sayısı ayarlanır.

Adım 2: Mevcut çıkış sinyalini hesaplayın. Eğitim örneğinin görüntülerinden biri ağın girişine verilir ve sinir ağının tüm nöronlarının çıkış değerleri belirlenir.

Adım 3. Sinoptik ağırlıkların ayarlanması. Sinir ağının çıktı katmanının ağırlıklarındaki değişimi aşağıdaki formülleri kullanarak hesaplayın:

Nerede , . Aşağıdaki formülleri kullanarak gizli katmanın ağırlıklarındaki değişimi hesaplayın: , Nerede

Adım 4. Tüm eğitim vektörleri için 2-3 arasındaki adımlar tekrarlanır. Eğitim görüntülerinin her biri e'yi aşmayan bir hata fonksiyonu değerine ulaştığında veya izin verilen maksimum yineleme sayısından sonra eğitim tamamlanır.

2. adımda, eğitim dizisinden girdiye vektörlerin rastgele sırayla sunulması daha iyidir.

Ağın giriş ve çıkışlarının sayısı, kural olarak, problemin koşullarına göre belirlenir ve gizli katmanın boyutu deneysel olarak bulunur. Tipik olarak içindeki nöronların sayısı girdi sayısının %30-50'sidir. Gizli katmandaki çok fazla nöron, ağın genelleme yeteneğini kaybetmesine neden olur (sadece eğitim örneğinin öğelerini iyice ezberler ve benzer örneklere yanıt vermez; bu, tanıma görevleri için kabul edilemez). Gizli katmandaki nöron sayısı çok azsa ağ öğrenemez.

Çözüm

Bir görüntünün tanınma için ilk hazırlığı sırasında ana sorunların yanı sıra bunları çözme yolları da dikkate alınır. Bulanık mantık kullanan ön işleme algoritması ve görüntü ikilileştirme süreci ayrıntılı olarak analiz edilmiştir. Sobel operatörünü kullanarak bir görüntüdeki sınırları tanımlamak için bulanık bir işleme algoritması oluşturulmuştur.

İnceleyenler:

Gagarina L.G., Teknik Bilimler Doktoru, Profesör, Bilgisayar Bilimleri ve Yazılım Bölüm Başkanı bilgi işlem sistemleri» Ulusal Araştırma Üniversitesi "MIET", Moskova.

Portnov E.M., Teknik Bilimler Doktoru, “Bilişim ve Bilgisayar Sistemleri Yazılımı” Bölümü Profesörü, Araştırma Laboratuvarı “Yöneticileri” Başkanı Bilgi sistemi» Ulusal Araştırma Üniversitesi "MIET", Moskova.

Bibliyografik bağlantı

Aung C.H., Tant Z.P., Fedorov A.R., Fedorov P.A. AKILLI MOBİL ROBOTLAR TARAFINDAN BULANIK MANTIK VE SİNİR AĞLARINA DAYALI GÖRÜNTÜ İŞLEME ALGORİTMALARININ GELİŞTİRİLMESİ // Günümüze ait sorunlar bilim ve eğitim. – 2014. – Sayı 6.;
URL: http://science-education.ru/ru/article/view?id=15579 (erişim tarihi: 02/01/2020). "Doğa Bilimleri Akademisi" yayınevinin yayınladığı dergileri dikkatinize sunuyoruz

Görüntü işlemenin özü, bir sahnenin orijinal görüntüsünü, nesnelerini tanıma problemini çözebilecek bir forma indirgemektir.

VS'de görüntü işlemenin nihai hedefi, sahne nesnelerini tanınmaya hazırlamaktır; görüntülerini önceden tanımlanmış bazı sınıflara atamak. Sunulan bilgi dönüştürme prosedürlerinin çeşitliliğine rağmen, STS'de genellikle üç ana işleme aşaması ayırt edilir:

1) görüntü ön işleme;

2) segmentasyon;

3) açıklama.

Ön işlemenin de iki temel aşaması vardır: görüntü oluşturma ve kodlama (sıkıştırma). Aşamaların sırası katı değildir ve spesifik göreve bağlıdır.

Görüntü ön işleme

STS'deki tüm görüntü ön işleme yöntemleri uzaysal ve frekansa bölünmüştür. Uzamsal yöntemler doğrudan görüntü pikselleri üzerinde çalışan prosedürlerdir. Parlaklık bir görüntü özelliği olarak kullanılır Y(x, y). Frekans yöntemleri, Fourier dönüşümü kullanılarak bir görüntünün karmaşık düzleme dönüştürülmesiyle ilişkilidir.

Ön işleme prosedürlerini değerlendirirken kendimizi yalnızca uzamsal yöntemlerle sınırlayacağız ve orijinal görüntü yarı ton olarak kabul edilecektir.

Ön işlemenin ilk aşamasında, görüntü oluşumu. Görüntü oluşumu, video işlemcisinin belleğinde bulunan, bir matris veya kontur oluşturan bir dizi ayrı öğe (piksel) biçiminde bir görüntüyü doğrudan elde etme prosedürüdür.

VS'de görüntü oluşturma aşamasında aydınlatma ayarlanarak bir parlaklık eşiği seçilir ve görüntü filtrelenir.

Filtrasyon Görüntü ön işlemenin en çok zaman alan ve karmaşık aşamasıdır. Genel olarak filtreleme aşağıdaki ana sorunları çözer:

· yumuşatma (“kar” gibi yüksek frekanslı parazitlerin bastırılması);

Artan kontrast

· anahat seçimi.

Düzeltme işlemi parlaklık eşiği seçildikten hemen sonra uygulanır. Anlamı, parlaklık fonksiyonunun değerlerinin belirli bir kurala göre ortalamasını almaktır. Y(X, y) analiz edilen görüntü parçasının içinde.

"Kar" gibi yüksek frekanslı parazitleri ortadan kaldırmak için alçak geçiren filtre kullanılır. Dezavantaj alçak geçiren filtreleme görüntü kontrastındaki bozulmadır.

Segmentasyon

Ön işlemenin bir sonucu olarak görüntü, nesnelerin bir veya daha fazla kontur gösterimini içerir. Bu konturları ayırma ve bunları belirli nesnelerle ilişkilendirme işlemine denir. segmentasyon.

Görüntünün birden fazla nesne içerdiği önceden biliniyorsa, görüntü kodlama aşamasından önce kenar çıkarma işleminden sonra bölütleme işlemi gerçekleştirilir.

Segmentasyon algoritmaları genellikle konturlardaki süreksizlikleri ve alanların benzerliğini aramaya dayanır. İlk durumda devre bulunur ve yazılım bypass'ı belirlenen kurala göre gerçekleştirilir. Kontur kapalı ise nesneye ait olduğu kabul edilir. İkinci durumda görüntünün ortak özelliklere sahip alanları (örneğin aynı piksel parlaklığı) belirlenir. Bu tür alanlar bulunduğunda ya arka plana ya da nesneye atanır.

Görüntü kodlama

Yarı tonlu görüntüleri uzamsal yöntemler kullanarak işleyen sistemler için iki ana kodlama yöntemi vardır:

· görüntü uzunluğu kodu yöntemini kullanarak görüntünün kendisinin kodlanması;

· Freeman zincir kodunu kullanarak görüntü konturunun kodlanması.

Her iki durumda da kodlama sırasında görüntüyü karakterize eden veri miktarında önemli bir azalma olur. Kodlama verimliliği, görüntü sıkıştırma derecesine göre belirlenir.

Kod yöntemini kullanarak kodlamanın özü seri uzunlukları, RLE algoritması kullanılarak uygulanan, piksellerin parlaklığının ve renklerinin aynı olduğu, görüntünün tarama çizgisinin tekdüze bölümleriyle temsil edilmesinden oluşur. Ayrıca her serinin özelliği karşılık gelen değer ve seri uzunluğu (piksel sayısı).

Görüntü konturunu doğrudan kodlamak için çoğunlukla zincir kodlama kullanılır. Freeman kodu(Şekil 6.22, B). Bu durumda, belirli bir noktadan başlayarak nesnenin konturu, 45'in katı olan bir modül eğim açısı ile ayrık değerler alan bir vektör dizisi tarafından belirtilir. Vektör eğim açısı ise modül değeri 2'dir. 45'tir ve konumu dikey veya yatay ise 1'dir. Eğrinin bir noktasından diğerine hareket ederken vektörün yönündeki değişiklik, modellenen eğrideki değişimin doğasını yansıtır.

Resmin açıklaması

Altında Tanım bir nesnenin karakteristik parametrelerinin belirlenmesini ifade eder - işaretler(ayrımcılar) onu sahneyi oluşturan her şeyden ayırmak için gereklidir.

Fiziksel özlerine göre işaretler küresel ve yerel olarak ikiye ayrılır. Genel işaret görüntüler bir nesnenin herhangi bir görüntüsü için hesaplanabilen bir özelliktir.

Yerel işaretler daha az sıklıkla kullanılır; görüntünün tamamını değil, yalnızca bir kısmını karakterize ederler. Bunlar, iki kontur çizgisi arasındaki açıyı, nesnenin görüntüsündeki deliklerin sayısını ve parametrelerini vb. içerir.

Görüntü tanıma

Tanıma bir nesnenin belirli bir görüntüsünün bir dizi özelliğine dayanarak onun belirli bir sınıfa üyeliğinin belirlendiği bir süreçtir.

Tanıma, görsel görüntü analizi işlevini uygular.

Geleneksel olarak, tüm tanıma yöntemleri iki gruba ayrılabilir: teorik ve yapısal. En yaygın teorik tanıma yöntemleri karar teorisinin ilkelerini kullanır.

Değerler her ölçümde farklılık gösterdiğinden, bir nesnenin niteliklerinin gerçek değerini belirlemek imkansızdır. Bu nedenle tanıma görevi şu şekilde ortaya çıkar: Bir nesnenin belirli bir sınıfa ait olma olasılığını belirleyin.

STZ'de görüntü tanımanın en ilginç alanlarından biri yüz tanıma algoritmalarının geliştirilmesiyle ilgilidir. Tanıma (doğrulama) algoritması kayıt algoritmasına yakındır. Mevcut görüntüden çıkarılan özellikler, bileşenleri veri tabanında bulunan tüm vektörlerin karşılık gelen bileşenleriyle karşılaştırılan bir özellik vektöründe birleştirilir.