Как да изберем оптималния размер на изображението за обучение на невронна мрежа за конволюция?

Когато обучавате Convolution Neural Network върху персонализиран набор от данни, изборът на правилното изображение е от решаващо значение. Това ще повлияе на времето за обучение и ефективността на модела. Освен това ще научим как да идентифицираме дали има проблеми с набора от данни.

Защо?

Преди да преминем към частта, нека обсъдим отрицателните последици от избора на грешен размер. След като изберем фиксирана ширина и височина, стандартната процедура е да преоразмерим всички изображения до този фиксиран размер. И така, сега всяко изображение попада в една от двете кофи.

Намаляване на размера: По-големите изображения ще бъдат намалени, което затруднява CNN да научи характеристиките, необходими за класифициране или откриване, тъй като броят на пикселите, където жизненоважната характеристика ще присъства, е значително намален.
Повишаване на мащаба: Когато малките изображения се увеличават и допълват с нула, тогава NN трябва да научи, че подплатената част няма влияние върху класификацията. По-големите изображения също се обучават по-бавно и може да изискват повече VRAM.

Така че трябва да изберем нашата отрова, колкото по-близо до оптималния размер на изображението сме, толкова по-добро е то.

Оптимален размер на изображението

Всички знаем, че изборът на правилния размер зависи от набора от данни, но въпросът е как да го направим? Визуализирайте размера на изображението.

Набор от данни: Наборът от данни за домашни любимци Oxford-IIIT

Този набор от данни съдържа повече от 7000 изображения с различен размер и разделителна способност.

От първия график изглежда, че повечето изображения са с разделителна способност по-малка от 500 на 500. След увеличаване можем ясно да видим, че изображенията са групирани около размер 300 или 500. Моята препоръка за този набор от данни е да започнете да обучавате невронната мрежа с размер на изображението 300 и постепенно го увеличавайте до 400 и го завършвайте с размер 500. По този начин моделът трябва да може да обобщава добре за различни разделителни способности на изображението.

Бонус

Няма ли да е страхотно, ако можем да видим основните изображения, докато инспектираме точките в графиката? Това може да ни помогне да идентифицираме следните потенциални проблеми.

Неправилно етикетирани данни: Може да обърка модела.
Определени изображения на класа са с много висока или ниска разделителна способност: може да направи модела предубеден.

2. След проверка, ако заключим, че някои точки от данни трябва да бъдат премахнати, тогава използвайте Селектор на ласо, за да постигнете това.

Как да изберем оптималния размер на изображението за обучение на невронна мрежа за конволюция?

Защо?

Оптимален размер на изображението

Бонус

Подобни въпроси