Пуснат Exploratory v5.0!

Нов дизайн и изживяване на потребителския интерфейс, пазарна кошница, дърво на решенията, клъстериране на K-средства, фиксиране на диаграма и още!

Изключително съм развълнуван да обявя Exploratory v5.0! Най-накрая! 🎉🎉🎉

Най-голямото нещо за тази версия е новият дизайн и изживяване на потребителския интерфейс. Започнахме да работим по него преди около 6 месеца, докато все още работехме по други разработки за серия v4.x по същото време. Това, което искахме да направим, е да направим анализа на данни и споровете с данни много по-лесни и забавни.

Научихме много от нашите потребители през последните 2 години и половина от началото на Exploratory. И програмите за обучение по наука за данни, които предоставяме, са едно такова място, където научихме много за това кои са трудните неща, когато хората започват пътуването си в науката за данните и кои са най-важните неща, когато се опитват да разберат данните.

И разбира се, ние непрекъснато учим много от нашите страхотни съществуващи потребители на Exploratory, които любезно постоянно ни дават много страхотни отзиви!

С такива знания и нашата неуморна работа към нашата визия за демократизиране на науката за данните, смятаме, че имаме страхотна версия тук за вас. Сега вие сте съдията, нямаме търпение да чуем какво мислите.

Ето списък с новите функции и подобрения за Exploratory v5.0.

Нов дизайн и изживяване на потребителския интерфейс

Най-голямата промяна за v5.0 е новият UI дизайн и опит. Всичко е свързано с „Простота и фокус“. Искахме да го направим така, че да можете да се съсредоточите върху това, което е по-важно, когато работите с данни.

При типичния анализ на данни нашите потребители прекарват по-голямата част от времето си в Data Wrangling, така че това определено е критичен елемент от анализа на данните. Но в същото време това, което те наистина искат да направят, е да визуализират данните и да ги анализират с алгоритми, така че да могат да намерят полезни прозрения, които им помагат да вземат по-добри решения.

Така че ние искахме да направим изживяването на боравенето с данни възможно най-просто, но мощно, но в същото време искаме то да не пречи на други задачи като визуализация на данни и анализи. когато не са необходими.

Така че прекарахме много време в препроектиране на цялото изживяване около тази област и това, което най-накрая измислихме, е v5.0. Изчистеният потребителски интерфейс, който предоставя просто, но мощно изживяване за изграждане и управление на канали за данни.

Стига приказки, нека да разгледаме един по един.

Управление на стъпките за преборване на данни от дясната страна, а не отгоре

В предишните издания използвахме зоната за команден токен в горната част, където управлявате операциите за разбиване на данни, като Mutate, Filter и т.н. И имахме дясната област „Стъпка“, където виждате списък с разбор на данни стъпки, всяка от които показва съответна R команда.

Във версия 5.0 премахнахме напълно зоната на горния команден токен и подобрихме зоната „Стъпка“ от дясната страна, за да централизираме всички операции около споровете с данни.

Първото нещо, което ще забележите в областта Стъпка, е, че вече не виждате R командите с един поглед. Вместо това виждате заглавието и токените (светлосив фонов бутон) за всяка стъпка.

И можете да щракнете върху някой от токените, за да отворите съответните диалогови прозорци (или потребителски интерфейси) директно за редактиране.

Разбиране и проучване на стъпките

Едно от важните неща за Data Wrangling е способността да се отстраняват грешки или да се разбира какво се случва в стъпките. Това става още по-важно, когато имате грешка някъде в стъпките. Така че направихме няколко неща, за да подобрим опита в тази област.

Незабавно изскачащ прозорец с мишката за показване на командите

Можете да преместите показалеца на мишката върху всеки жетон, за да видите какво има вътре в жетона.

Можете също да преместите показалеца върху заглавието на стъпката, за да видите цялата R команда за всяка стъпка.

Маркирайте свързани токени, като щракнете върху колона в изгледи на таблица/обобщени данни

Щракването върху колона в таблица или обобщен изглед ще маркира токените, които използват колоната. Това е полезно, особено когато искате да знаете как е създадена колоната и как промяната, която ще направите в колоната, ще повлияе надолу по веригата.

Когато получите грешка

Когато получите грешка някъде в стъпката за разбиване на данни, сега се показва коя стъпка произвежда грешката в съобщението за грешка в горната част. Освен това невалидната стъпка се обозначава със заглавието й, показано в червен цвят.

Ето пример, когато имате грешка в Стъпка 6.

Разделете една стъпка на няколко стъпки

За стъпките, които могат да имат множество токени, като Mutate, Filter и т.н., отстраняването на грешки може да стане по-трудно. Кой токен създава грешката?

За целта можете да „разгрупирате“ стъпката в няколко стъпки.

Това ще ви помогне по-лесно да определите коя операция има проблема. В този случай можете да видите, че първият Mutate (стъпка 8) има проблем.

Комбинирайте няколко стъпки в една стъпка

Можем ли отново да съберем тези токени като една стъпка?

Да, можеш!

Изберете няколко стъпки с клавиша Command / Control или клавиша Shift, след което щракнете върху иконата „Комбиниране на няколко стъпки“.

Ще видите една създадена стъпка, която съдържа трите операции за мутиране като токени.

Стъпка на движение

Както можехте да правите преди, можете да плъзнете и пуснете стъпката, за да ги преместите дори с този нов потребителски интерфейс. Просто вземете заглавната област на всяка стъпка и я преместете там, където искате.

Също така, разбира се, че можете да копирате, изрязвате и изтривате стъпките точно както преди!

Деактивирайте стъпките

Можете бързо да деактивирате всяка стъпка. Това е полезно, когато искате бързо да опитате да изпълните стъпките със или без определена стъпка.

Просто щракнете върху иконата „Деактивиране на стъпка“, за да деактивирате стъпката.

Това ще направи стъпката сива и ще накара стъпките за разбиване на данни да я игнорират, когато се изпълнява.

Можете да щракнете върху иконата „Активиране на стъпка“, за да върнете стъпката бързо назад.

Добавяне на стъпки

Можете да добавите стъпките за преборване на данни, като изберете меню от менюто на заглавката на колоната или изберете команда от бутона Плюс в горната част на областта за стъпки.

Меню за заглавка на колона

Бутон плюс в горната част на стъпка

Експортиране на данни

Има два типа данни, които можете да експортирате.

Данни за стъпки

Това е за експортиране на данните, които се генерират на избраната стъпка от тръбопровода за обработка на данни.

Диаграма/Данни от анализ

Това е за експортиране на данните, произведени от диаграмата или анализа.

Разгъване и свиване

Едно нещо при споровете с данни е, че лесно можете да завършите с много стъпки, което прави по-трудно да видите какво се случва на високо ниво.

Сега можете да щракнете върху бутона „Свиване“ в дясната горна част, за да покажете само заглавията на стъпките.

Скриване на зоната за стъпки

Стъпките за разбор на данни са критична част от анализа на данни, но не е като да ги виждате винаги. Ако е така, можете да го скриете, когато не ви трябва.

Това ще даде повече място за диаграмата и анализите.

Резюме

Вече можете да търсите в колоните под Обобщен изглед! Това е полезно, когато имате много колони.

Data Wrangling Command UIs

Искаме да продължим да правим Data Wrangling по-лесен и по-забавен, като предоставяме страхотно потребителско изживяване за всяка командна стъпка на Data Wrangling.

В тази версия въвеждаме два нови потребителски интерфейса за командите за преборване на данни, Избор и Пренареждане.

Изберете Колони

В новия диалогов прозорец за избор можете да изберете колоните, като щракнете върху тях една по една или да изберете няколко колони заедно, като използвате бързо клавиша Shift.

Можете също да търсите в колоните, като напишете името. Това е полезно, когато имате голям брой колони.

Той поддържа два режима, единият е да включва избраните колони, а другият е да изключва колоните.

Пренареждане на колони

Създадохме специален диалогов прозорец на потребителския интерфейс, където можете да пренаредите колоните.

Можете просто да плъзнете и пуснете колоните, за да ги пренаредите.

Персонализирана командна стъпка

Една от любимите ми възможности на Exploratory е неговата разширяемост. И Data Wrangling е една голяма област, в която разширяемостта блести.

Можете да изпълните всяка R команда като стъпка, стига тя да приема рамка с данни като вход и да връща рамка с данни като изход.

Можете да добавите персонализирана команда R, като изберете „Персонализирана команда“.

И можете да въведете командата в новия диалогов прозорец „Персонализирана команда“.

И сега можете да въведете командата на няколко реда! ;)

Работа с часова зона

Работата с чувствителните към времето данни може лесно да се усложни поради часовата зона.

Когато импортирате данните с информация за часа, но не и с информация за часовата зона, те ще бъдат разпознати като часова зона UTC. Но разбира се, това може да е грешно, освен ако не живеете в часовата зона UTC.

Неправилно зададената часова зона не е най-лошата част от проблема. Най-лошото е, че е трудно да разберете как се регистрират вашите данни за времето. Това UTC ли е? PT (тихоокеанско време в САЩ)? JT (японско време)?

Така че във v5.0 започнахме да показваме часовата зона заедно с информацията за времето за всички колони с тип данни POSIXct.

След като разберете как са зададени данните за часовата зона, това е сравнително лесно да се коригира.

Вижте следната бележка, ако искате да знаете как да конвертирате или коригирате часовата зона.

Поддръжка на папки в потребителския интерфейс на каталога

Когато имате много кадри с данни в един и същ проект, става по-трудно да ги организирате. Така че ние добавяме поддръжка на папки във v5.0. Можете да създавате папки и просто да плъзгате и пускате рамки с данни в тях.

Можете да организирате своето табло за управление, бележка, слайдове, като използвате и „Папка“, въпреки че те трябва да са все още в секцията „Документи“ и да не са заедно с рамки за данни.

Визуализация / Диаграма

Фиксиране на диаграма

„Закрепване“ на диаграма всъщност е супер полезна функция, която е уникална за Exploratory опит, ако знаете как работи.

Това обаче е, че ако не го знаете, лесно ще се разочаровате, когато видите диаграмите си счупени, защото някои от колоните, използвани в диаграмите, не съществуват в текущо избраната стъпка.

Така че направихме няколко промени в тази област.

Първо, „закрепването“ на диаграмата сега е поведението по подразбиране. Това означава, че всяка нова диаграма, която ще създадете, ще бъде „закрепена“ към текущо избраната стъпка.

Стъпката, която е „Закачена“, показва зелен фон, за да покаже, че е „Закачена“.

Но това също означава, че ще искате да превключите стъпката „Закачена“, когато добавите нова стъпка за преборване на данни, тъй като диаграмата все още е „Закачена“ към предишната стъпка. Можете да щракнете върху бутона „Закачи“, за да закачите или откачите точно както правехте преди, за да промените стъпката „Закачено“. Но ние не спряхме до тук.

Искахме да направим това „закрепване“ изживяване по-лесно и по-забавно. Затова добавихме поддръжка за плъзгане и пускане. За да преместите стъпката „Pinned“, можете просто да плъзнете бутона „Pin“ и да го пуснете до стъпката, която искате да „Pin“!

Превъртане на раздела на диаграмата, няма повече меню!

Ето още едно подобрение в областта на графиката. Ще можете просто да превъртате разделите на диаграмата, когато имате много диаграми и да видите миниатюрните изображения, за да видите какви са тези раздели.

Няма повече раздел „Още“, ако разбирате какво имам предвид. ;)

Анализ

Дърво на решенията

Дори когато имате Random Forest, XGBoost и т.н. на пръстите си, когато става въпрос за комуникация с другите, Decision Tree все още върши страхотна работа.

След като получихме много заявки от нашите потребители, най-накрая го добавяме към изгледа на Google Анализ.

Има следните раздели за различни видове информация. Те са много подобни на това, което бихте видели с „Променлива важност с произволна гора“.

  • Дърво — това е визуализация на дървото, изградено за прогнозиране на целевата променлива.
  • Важност — Можете да видите кои променливи са по-важни за прогнозиране на целевата променлива.
  • Обобщение — Можете да видите ефективността на прогнозиране на модела.
  • Обобщение по клас — Можете да видите ефективността за всеки клас. Например, ако изграждате модел за предсказване на логически изход (ВЯРНО или НЕВЯРНО), тогава ще имате ефективността на предсказване за ВЯРНО и НЕВЯРНО отделно.
  • Класификационна таблица — Това е това, което е известно като матрица на объркване. Можете бързо да сравните прогнозирания резултат с действителния резултат и да видите за коя област този модел е добър за прогнозиране.

Ние използваме „rpart.plot“ R пакет за тази визуализация на дърво.

Анализ на пазарната кошница / Правила за асоцииране

Алгоритъмът за правила за асоцииране ви помага да разберете кои са елементите, които се показват заедно. Обичайният случай на употреба е да се предвиди какво би купил клиентът въз основа на другите артикули, които вече купуват. Някой, който си е купил памперси, е склонен да купи бира от шест опаковки, например.

Има добре познат R пакет, наречен „arules“, който имплементира алгоритъма за асоцииране, и потребителите на Exploratory го използват чрез командната стъпка. Сега, с v5.0, можете да получите достъп до него в изглед на Анализ!

Написахме тази публикация в блога преди известно време, за да обясним какво прави алгоритъмът на правилото за асоцииране. Публикацията е написана въз основа на опита с командната стъпка, но можете да видите какво представлява и как да интерпретирате изхода. Планираме скоро да го актуализираме с този нов изглед на Google Анализ.

K-означава групиране

Добавихме K-means Clustering към изглед на Google Анализ!

Дори преди v5.0 вече можехте да изпълнявате K-средните като стъпка за преборване на данни, което ви дава резултата за клъстериране за всеки ред. След това можете да визуализирате резултата по желания от вас начин.

Но има две предизвикателства при използването на алгоритъма на K-средните. Единият е как да зададете „K“ като броя на клъстерите, които ще изградите. Това 5 или 10 ли е?

Друг е, да кажем, че имате 5 клъстера, в които са групирани вашите клиенти, тогава какво означава всеки клъстер или как тези клъстери се различават един от друг?

Затова въвеждаме K-means Clustering в изглед на Analytics, за да отговорим на тези две предизвикателства. Има много какво да се говори за това вълнуващо ново допълнение, така че написах отделна бележка, посветена на тази функция. Разгледайте следната бележка, ако се интересувате.

  • Въведение в клъстерирането на K-Means в изгледа на Анализ — Връзка

Прогнозиране на времеви редове — Пророк

Добавихме следните свойства към „Прогнозиране на времеви серии (Prophet)“, за да поддържаме някои от параметрите на алгоритъма на Prophet.

  • Поддръжка за празник в изглед на Google Анализ
  • Долна граница за тенденция

Освен това добавяме „Ежедневен сезонен изглед“, когато данните съдържат информация на почасово ниво.

Избор на колона

Избирането на множество променливи в Анализ вече е много по-лесно благодарение на новия диалогов прозорец за избор на колони.

Можете да използвате клавиша Shift, за да изберете бързо няколко колони.

Освен това можете да търсите в колоните, които търсите.

Експортиране на диаграма като изображение

Получавали сме това искане често в миналото. И сега можете да го направите! ;)

Създайте рамка с данни с резултата

Изпълнението на анализа в изглед на Анализ може да доведе до ценни данни. И понякога може да искате да използвате данните за визуализиране или за други канали за преборване на данни.

Сега можете да запишете резултата като нов кадър с данни, като просто изберете „Запазване като нов кадър с данни“.

Публикуване на анализи

Сега можете да публикувате своите анализи в Exploratory Cloud или Exploratory Collaboration Server. Това ще улесни споделянето на вашите анализи с други, също така можете да вградите диаграмите във вашите уебсайтове и да планирате анализите периодично.

Табло / Бележки / Слайдове

Режим един до друг срещу единичен режим

Изгледът „Едно до друго“ прави много по-лесно писането на бележка, докато виждате резултатите, особено когато в бележката има диаграми и изображения.

И така, направихме Side-by-Side като режим по подразбиране. Когато създадете нова бележка или отворите съществуващите бележки, тя ще се отвори в режим една до друга.

Но понякога може да предпочетете режима „Единичен изглед“ за по-голямо пространство за писане. След това можете просто да щракнете върху бутона „Режим на единичен изглед“, за да превключите на режим „Единичен изглед“.

Отворете бележката в отделен прозорец

Когато пишете Бележки, често искате да отворите рамките с данни и да видите или актуализирате диаграмите и анализите. Така че е много по-лесно да продължите да отваряте Бележки, докато редактирате диаграмите или работите върху споровете с данни.

Затова направихме „Отваряне в отделен прозорец“ поведението по подразбиране, когато създавате нова бележка.

Освен това сега можете директно да отваряте съществуващи бележки, слайдове и табло за управление в отделен прозорец от менюто за действие, без да затваряте кадрите с данни, които преглеждате.

Дори когато отворите Бележки, Слайдове и Табло за управление в главния прозорец, пак можете да го отворите в отделен прозорец, като щракнете върху този бутон.

Меню за експортиране

Вече поддържаме „Експортиране в EDF“ за бележки, слайдове и табло за управление. Той експортира вашите бележки, слайдове и табло за управление в възпроизводим формат. Това означава, че ако вашите бележки, слайдове и табло за управление включват диаграми или анализи, съответните им кадри с данни също ще бъдат експортирани заедно. Това прави възможно споделянето на вашите Бележки, Слайдове и Табло за управление с други, които по-късно могат да импортират EDF в своя Exploratory и да възпроизведат всички стъпки за преборване на данните, за да се получи окончателният изход на Бележки, Слайдове и Табло за управление.

Това е всичко за новите функции!

Все още имаме много други подобрения и корекции на грешки. Разгледайте бележката за изданието за пълния списък.

Не забравяйте да изтеглите v5.0 от нашата страница за изтегляне, за да започнете да го изследвате още днес!

Ако все още нямате акаунт в Exploratory, регистрирайте се от нашия уебсайт за 30 дни безплатен пробен период без кредитна карта! Ако вашият пробен период е изтекъл в миналото, но искате да изпробвате тази нова версия, не се колебайте да се свържете с нас на [email protected] !

И накрая, ако случайно сте настоящ ученик или учител в училище, безплатно е!

Честит Exploratory v5.0! 🍾

наздраве,

Кан

R пакети, споменати в тази публикация: