Когато обучавате Convolution Neural Network върху персонализиран набор от данни, изборът на правилното изображение е от решаващо значение. Това ще повлияе на времето за обучение и ефективността на модела. Освен това ще научим как да идентифицираме дали има проблеми с набора от данни.

Защо?

Преди да преминем към частта, нека обсъдим отрицателните последици от избора на грешен размер. След като изберем фиксирана ширина и височина, стандартната процедура е да преоразмерим всички изображения до този фиксиран размер. И така, сега всяко изображение попада в една от двете кофи.

  • Намаляване на размера: По-големите изображения ще бъдат намалени, което затруднява CNN да научи характеристиките, необходими за класифициране или откриване, тъй като броят на пикселите, където жизненоважната характеристика ще присъства, е значително намален.
  • Повишаване на мащаба: Когато малките изображения се увеличават и допълват с нула, тогава NN трябва да научи, че подплатената част няма влияние върху класификацията. По-големите изображения също се обучават по-бавно и може да изискват повече VRAM.

Така че трябва да изберем нашата отрова, колкото по-близо до оптималния размер на изображението сме, толкова по-добро е то.

Оптимален размер на изображението

Всички знаем, че изборът на правилния размер зависи от набора от данни, но въпросът е как да го направим? Визуализирайте размера на изображението.

Набор от данни: Наборът от данни за домашни любимци Oxford-IIIT

Този набор от данни съдържа повече от 7000 изображения с различен размер и разделителна способност.

От първия график изглежда, че повечето изображения са с разделителна способност по-малка от 500 на 500. След увеличаване можем ясно да видим, че изображенията са групирани около размер 300 или 500. Моята препоръка за този набор от данни е да започнете да обучавате невронната мрежа с размер на изображението 300 и постепенно го увеличавайте до 400 и го завършвайте с размер 500. По този начин моделът трябва да може да обобщава добре за различни разделителни способности на изображението.

Бонус

  1. Няма ли да е страхотно, ако можем да видим основните изображения, докато инспектираме точките в графиката? Това може да ни помогне да идентифицираме следните потенциални проблеми.
  • Неправилно етикетирани данни: Може да обърка модела.
  • Определени изображения на класа са с много висока или ниска разделителна способност: може да направи модела предубеден.

2. След проверка, ако заключим, че някои точки от данни трябва да бъдат премахнати, тогава използвайте Селектор на ласо, за да постигнете това.