Предсказуем и предписващ анализ за бизнеса

Машинно обучение

Машинното обучение е метод за изчислително обучение, който е в основата на повечето приложения с изкуствен интелект (AI). В ML системите или алгоритмите се подобряват чрез опит с данни, без да разчитат на изрично програмиране. Алгоритмите за ML са широкообхватни инструменти, способни да извършват прогнози, като същевременно се учат от над трилиони наблюдения.

Видове анализ на данни

  • Описателен анализ: Това е основната форма на анализ, която събира големи данни и предоставя полезна информация за миналото.
  • Прогностичен анализ: Използва различни техники за статистическо моделиране и машинно обучение, за да анализира минали данни и да прогнозира бъдещи резултати.
  • Преписващ анализ: Нова форма на анализ, която използва комбинация от бизнес правила, машинно обучение и изчислително моделиране, за да препоръча най-добрия курс на действие за всеки предварително определен резултат.

Практически подход

Прогнозиране на цените на диамантите

Общ преглед на проекта

Компания за бижута иска да наддаде за закупуване на голям набор от диаманти, но не е сигурна колко трябва да предложи. В този проект ще използвате резултатите от прогнозен модел, за да направите препоръка за това колко бижутерската компания трябва да предложи за диамантите.

Подробности за проекта
Дистрибутор на диаманти наскоро реши да напусне пазара и пусна комплект от 3000 диаманта на търг. Виждайки това като чудесна възможност да разшири своя инвентар, една компания за бижута прояви интерес да направи оферта. За да решите колко да предложите, ще използвате голяма база данни с цени на диаманти, за да изградите модел за прогнозиране на цената на диамант въз основа на неговите атрибути. След това ще използвате резултатите от този модел, за да направите препоръка за това колко трябва да предложи компанията.

Моят подход

Разбиране на данните
Има два набора от данни. diamonds.csv съдържа данните, използвани за изграждане на регресионния модел. new_diamonds_new.csv съдържа данните за диамантите, които компанията би искала да закупи. И двата набора от данни съдържат данни за карати, изрязване и чистота за всеки диамант. Само наборът от данни diamonds.csv има цени. Трябваше да предвидя цените за набора от данни new_diamonds.csv.

Визуализация на данни

Разглеждайки връзката между карата и цената в диаграмата на разсейване по-горе, моделът прогнозира добре средните цени, но може да е много лош за определени диаманти. Въпреки че формулата може да не е точна за отделен диамант, тя трябва да свърши прилична работа при прогнозиране на цената, която трябва да платим за няколко диаманта наведнъж, тъй като средно изглежда представително.

Съществува линейна зависимост между каратаи ценатаза новия диамант (предвидена) точно както беше за стария диамант.

Всички предикторни променливи бяха тествани, докато стигнах до тези няколко характеристики, които бяха изключително значими за регресионния модел, т.е. имащи P-стойности ‹0,05.
Регресионно уравнение =-5 269 + 8 413 x Карат + 158,1 x Cut + 454 x Чистота

Моята препоръка

Каква цена препоръчвате да предложи фирмата за бижута? Моля, обяснете как стигнахте до това число

По отношение на това колко трябва да наддаде компанията за целия комплект от 3000 диаманта, препоръчвам малко от $8,213,465.93. Стигнах до тази цифра, като използвах регресионното уравнение, получено от предишните продажби на диаманти, и го приложих към новите диаманти, които се наддаваха. Тъй като компанията обикновено купува диаманти от дистрибутори на 70% от тази цена, така че умножавам прогнозираната сума $11,733,522.76 по 0,70, за да получа крайната прогнозирана оферта от $8,213,465.93.

Препратки