Групиране на квартали

Това е първият ми блог. Така че наистина не знам как да продължа с това, но ще опитам най-доброто от моето ниво!

Това блокиране на коронавируса донесе много време за много от нас, което може да бъде използвано конструктивно. Реших да подобря уменията си с някои проекти и курсове, фокусирани върху приложението. Този блог е за проект, който направих за курс.

Лондон, столицата на Англия и Обединеното кралство, е едно от най-случващите се места в света. Бизнес, образование, пътуване и какво ли още не. Това е дестинация в списъка на всеки човек и с това идва основен въпрос кое МЕСТОПОЛОЖЕНИЕ! да останете, къде да работите, къде да посетите, в случай на бизнес къде да го създадете, да кажем къде да създадете ресторант в Лондон. Кое място би било най-доброто за създаване на бизнес за предоставяне на услуги. По същия начин, ако сте студент, който се е преместил да учи, къде трябва да наемете място за живеене. Независимо дали искате спокойни места или предпочитате да сте около оживени места като турист.

Няколко проблема, едно решение, машинно обучение!

Създадох много обобщен модел, за да отговоря на тези въпроси, който може да даде препоръки за места във всяка част на света. В този проект пуснах модела специално за Лондон.

Необходими данни:Първото изискване беше наборът от квартали и квартали в Лондон. Тези данни са получени от wikipedia. Бракувах тази страница с помощта на библиотеката Pandas. Като алтернатива тази задача може да се изпълни и с помощта на пакета Beautiful Soup. Географските ширини и дължини, необходими за нанасяне върху картата, бяха получени с помощта на пакета geopy.gecoders.
Най-важните данни, на базата на които групирах кварталите, данните, базирани на местоположението, бяха получени с помощта на Foursquare APIкойто включва подробности за местата в кварталите и тяхната категория и географски координати. Като алтернатива може да се използва и API на Google Maps.

Методологията, която приех, беше K-Means Clustering. Използвах вградения алгоритъм за клъстериране на scikit klearn библиотеката на Python, за да групирам кварталите на Лондон въз основа на сходството на местата в тях. Това води до това, че кварталите имат подобен тип заведения или по-точно подобни типове най-посещавани заведения, които се групират заедно.

Визуализацията тук се превръща в предизвикателство и благодаря на проекта Capstone на IBM за това, че ме запозна с библиотеката Folium, пакет на едно място за визуализиране на данни върху карти. След много опити за различен брой клъстери, реших да използвам 14 клъстера, което доведе до получаване на 8 основни клъстерадокато другите могат да се третират като извънредни. Тези клъстери могат да бъдат идентифицирани с техните специфични характеристики, отличаващи всеки от тях от останалите.

Въз основа на отличителните характеристики на кварталите, сега можем да препоръчаме местоположения на заинтересованите страни. По-долу има екранна снимка на картата на Лондон.

Алгоритъмът е доста лесен за разбиране и може да бъде разширен до почти всяка част на света, докато може да са необходими някои промени при извличането и почистването на данни.

Свържете се с мен, ако искате да обсъдим това или искате да го управлявате за място по ваш избор.

Групиране на квартали

Подобни въпроси