Визуализацията на данни има богата и разнообразна история, обхващаща стотици години. Претърпя множество трансформации и подобрения, като се разви от прости диаграми и графики до сложни, интерактивни визуализации, захранвани от сложен софтуер и технологии за големи данни. В тази статия ще разгледаме ключовите събития, важни иновации и забележителни хора, които са оформили областта на визуализацията на данни в това, което е днес.

Ранни дни

Най-ранната форма на визуализация на данни може да бъде проследена до 17-ти век, когато за показване на данни са използвани обикновени лентови и линейни графики. Тези графики са начертани на ръка и са използвани за визуализиране на данните по по-разбираем начин от необработените числа и статистики. Това беше голям скок напред в областта, тъй като позволи на хората да разбират и интерпретират по-добре сложни данни, което води до по-информирано вземане на решения.

Една от най-забележителните фигури от този ранен период е Уилям Плейфеър, шотландски инженер и икономист, който се смята за бащата на графичните методи на статистиката. Playfair беше пионер в областта на визуализацията на данни и се смята за изобретяването на линейната графика и стълбовата диаграма, които все още се използват широко днес.

Стълбовата диаграма на Playfair, показваща износа и вноса на Шотландия към и от различни части за една година от Коледа 1780 до Коледа 1781.

Следващият важен крайъгълен камък в историята на визуализацията на данни беше изобретяването на кръговата диаграма. Кръговата диаграма позволява представянето на данни по начин, който е лесен за разбиране и тълкуване, и бързо се превръща в популярен инструмент за визуализация на данни. Използван е за показване на данни в различни области, включително наука, бизнес и правителство, и остава един от най-често използваните видове диаграми днес.

Кръгови диаграми, Уилям Плейфеър, 1801 г. От, The Commercial and Political Atlas: Representing, by Means of Stained Copper-plate Charts, Progress of the Commerce, Revenues, Expenditure and Debts of England During the Whole of the Eighteenth Century, 3rd edn . Публичен домейн.

Влиянието на технологиите

В края на 19-ти и началото на 20-ти век напредъкът в технологиите проправи пътя за нови иновации във визуализацията на данни. Изобретяването на компютъра и развитието на компютърната графика позволи създаването на по-сложни визуализации, като топлинни карти и диаграми на разсейване. Тези нови форми на визуализация позволиха показването на множество променливи в едно изображение, осигурявайки по-изчерпателен изглед на данните.

Друго ключово нововъведение в историята на визуализацията на данни беше въвеждането на Географски информационни системи (ГИС) през 60-те години на миналия век. ГИС беше голям пробив в областта, тъй като позволи картографирането на данни в пространствен контекст. Това предостави нов начин за визуализиране на данни и помогна да се разкрият модели и връзки, които биха били трудни за забелязване при използване на традиционни методи.

Горната визуализация демонстрира броя на произшествията, станали по магистралите в САЩ през 2015 г. — зеленият цвят показва нула смъртни случаи на 1000 мили, докато най-тъмното червено показва над 100 смъртни случая.

Модерни дни

Възходът на интернет и нарастването на големите данни през последните години оказаха голямо влияние върху визуализацията на данни. Наличието на огромни количества данни направи възможно създаването на по-сложни и интерактивни визуализации, които могат да се използват за изследване и анализ на данни по нови и вълнуващи начини. Разработването на софтуер като D3, Matplotlib и ggplot улесни разработчиците да създават и споделят визуализации. Някои търговски алтернативи като Tableau и PowerBI също помогнаха на повече хора да създават диаграми и отчети (в много бизнес ориентирани сценарии). Тези инструменти са станали популярни в различни индустрии, включително финанси, здравеопазване и маркетинг и др.

Друго важно развитие в историята на визуализацията на данни е възходът на журналистиката на данните. Журналистите на данни използват визуализации, за да разказват истории и да съобщават информация по начин, който е ангажиращ и достъпен за обществеността. Това спомогна за предоставянето на визуализация на данни на по-широка аудитория и повиши осведомеността за важността на данните в живота ни.

Забележителни фигури

Една от най-забележителните фигури в историята на визуализацията на данни е Едуард Тафт, статистик и професор в Йейлския университет. Tufte беше основен защитник на използването на визуализация на данни при вземането на решения и той написа няколко влиятелни книги по темата, включително „Визуалното показване на количествена информация“ и „Представяне на информация“. Работата на Tufte спомогна за популяризирането на визуализацията на данни и има трайно въздействие върху тази област.

Друг много важен принос за визуализацията на данни е Майк Босток, създателят на D3.js или документите, управлявани от данни. D3 е JavaScript библиотека с отворен код за създаване на динамични и интерактивни визуализации на данни в уеб браузъри. D3 е известен със своите мощни възможности, включително способността си да обвързва данни с модела на обектния документ (DOM) и способността си да манипулира структурата и външния вид на визуализациите въз основа на данните. Това прави възможно създаването на силно интерактивни визуализации с възможност за персонализиране, като например мрежови графики, диаграми на разсейване и топлинни карти.

Най-добрите технологии за визуализация на данни

Когато става въпрос за създаване на елегантни, интерактивни и проницателни решения/продукти за визуализация, има няколко популярни опции:

  1. D3.js: Споменатият по-горе D3.js е JavaScript библиотека с отворен код, която се използва за създаване на динамични и интерактивни визуализации на данни. Той се използва широко от специалисти по данни и уеб разработчици и предоставя мощна платформа за създаване на персонализирани визуализации.
  2. Matplotlib: Matplotlib е библиотека на Python, която се използва за създаване на статични, анимирани и интерактивни визуализации. Той се използва широко в науката за данни и е популярен инструмент за създаване на визуализации в научните и изследователски общности.
  3. ggplot2: ggplot2 е библиотека за визуализация на данни в езика за програмиране R. Той се използва широко от учените по данни и е известен със своя интуитивен синтаксис и способност за създаване на сложни визуализации.

Две опции по-долу, колкото и популярни да са, не са с отворен код, така че няма да отделям твърде много време и усилия за тях. Но те помогнаха за насърчаване на еволюцията на визуализацията на данни през последните години, така че мисля, че заслужават някои почетни споменавания.

  1. Tableau: Tableau е мощен и удобен за потребителя инструмент за визуализация на данни, който се използва широко в различни индустрии. Той позволява на потребителите да създават интерактивни табла, карти и диаграми и се интегрира с широк набор от източници на данни.
  2. PowerBI: PowerBI е базиран на облак инструмент за визуализация на данни от Microsoft, предназначен за бизнес потребители. Той предоставя лесен за използване интерфейс за създаване и споделяне на визуализации и се интегрира с други продукти на Microsoft като Excel и SharePoint.

Javascript е неизбежен

Като ветеран разработчик на Python се надявах да създам интерактивни и споделяеми визуализации само в Python. Въпреки това, след няколко години настройване, четене на документация, прескачане на различни библиотеки на Python, игра със стотици тетрадки, трябваше (в началото неохотно) да призная, че Javascript е неизбежен.

JavaScript със сигурност е една от най-популярните и широко използвани технологии за изграждане на визуализации на данни за уеб. Има голяма и активна общност от разработчици и има много налични библиотеки и инструменти с отворен код, които улесняват изграждането на интерактивни уеб базирани визуализации. В допълнение към D3.js, някои от най-популярните библиотеки за визуализация на данни в JavaScript включват:

  1. Echarts: Моята предпочитана опция за визуализация на данни. ECharts (Enterprise Charts) е популярна библиотека за визуализация на данни с отворен код за мрежата, базирана на JavaScript. Той се използва широко за изграждане на широк набор от диаграми и графики, включително стълбовидни диаграми, линейни диаграми, кръгови диаграми и др. ECharts предоставя голям брой предварително изградени визуализации и поддържа персонализирани визуализации и е проектиран да бъде много гъвкав и адаптивен. Може също така лесно да се интегрира в модерни фронтенд рамки/библиотеки като Vue, React и Angular.
  2. Chart.js: Това е проста и лесна за използване библиотека за изграждане на диаграми и графики в браузъра. Той предоставя широка гама от типове диаграми и е проектиран да бъде лесен за използване както от разработчици, така и от неразработчици.
  3. Three.js: Това е библиотека за изграждане на 3D визуализации в браузъра. Той предоставя голям брой предварително изградени визуализации и поддържа персонализирани визуализации и се използва широко за изграждане на интерактивни и потапящи визуализации.
  4. Highcharts: Това е търговска библиотека за изграждане на диаграми и графики в браузъра. Той предоставя широка гама от типове диаграми и се използва широко в търговски приложения.
  5. Plotly.js: Да Plotly има js версия. Това е популярна библиотека с отворен код за изграждане на интерактивни визуализации на данни. Той предоставя широк набор от типове диаграми, включително линейни диаграми, стълбовидни диаграми, точкови диаграми и други, и се използва широко за изграждане на интерактивни табла и приложения за данни.
  6. C3.js: Това е библиотека с отворен код за създаване на диаграми и графики, базирана на библиотеката D3.js. Той предоставя прост и интуитивен API за изграждане на диаграми и се използва широко за изграждане на динамични и интерактивни визуализации на данни.

Наистина страхотни класации за линейни състезания, направени от Echarts.

Историята на визуализацията на данни е богата и разнообразна и е претърпяла множество трансформации и напредък през вековете. От изобретяването на прости стълбовидни и линейни графики през 17 век до възхода на журналистиката с данни и технологиите за големи данни през последните години, визуализацията на данни е мощен инструмент за разбиране и тълкуване на данни. Ключови събития, важни иновации и забележителни хора помогнаха за оформянето на полето и превръщането му в това, което е днес. С непрекъснатия растеж на данните и нарастващото значение на вземането на решения, базирани на данни, бъдещето на визуализацията на данни е светло и вълнуващо.

В следващите серии ще проуча и публикувам повече статии за използването на Javascript за създаване на красиви и интерактивни визуализации на данни.