Едно нещо, което забелязах напоследък, е фактът, че много от класификационните набори от данни имат класови дисбаланси. Наборът от данни, върху който работя в тази публикация в блога, не е изключение, така че трябваше да изчисля теглата за всеки клас в опит да се справя с този дисбаланс. Наборът от данни, който използвах, е състезание на общността на Kaggle, което може да се намери тук...