Чрез моето новоразработено пътуване да стана учен по данни/инженер по машинно обучение, девет от десет пъти избирам тема, която ще има социално въздействие. Първият ми проект е този, който бих искал да обсъдя с вас. Този проект попада в „Стандартизиран тестов анализ“. Ще ви преведа през моето изложение на проблема, мисловен процес, аналитични прозрения и препоръки.

Мислейки като новообучен специалист по данни, какво е първото нещо, което трябва да направя? Ако не сте се досетили досега, това е изявление за проблем. Научих, че формулирането на проблем е в основата на всеки проект, защото данните могат да ви отведат навсякъде, но когато имате въпрос в ума си, това ви помага да се съсредоточите върху решаването на този проблем. Така че с този проект ми бяха дадени скорошни SAT/ACT резултати като данни. Подходих към този проект, като симулирах, че приемната комисия на Принстънския университет ме е наела като консултант. Проблемът, който създадох, е „Как да увелича приема на афроамериканци в техния университет чрез редактиране или премахване на техните изисквания за SAT/ACT? Изложението на проблема имаше идеален смисъл за мен и беше в съответствие с моите принципи за подпомагане при решаването на проблеми със социалното въздействие.

След това искам да споделя малко основна информация, за да ви помогна да видите колко важно е това изложение на проблема за маргинализираните общности, особено за афро-американската общност. Започвайки с това, знаете ли, че изобретателят на SAT, Карл Бригъм, е бил верен „евгеник“? Бригъм призна, че не е имал намерение афро-американската общност да се справи добре на тези изпити. Ако не знаете какво е евгеник, човек вярва, че расата му е по-висша и не трябва да се смесва с другите. Така че, вярвате или не, имаше много расизъм в самия SAT/ACT, защото преди това беше предназначен да изключи афро-американското население. Повдигам това, защото обществото през цялото време се е опитвало да намали афро-американската общност с дискриминация във всички аспекти, използвайки такива примери за „червена линия“.

Но да се върнем към изложението на проблема, приемните комисии в колежите отбелязват намаляване на кандидатурите от афро-американски студенти и слабо участие за SAT/ACT. Например университетът в Принстън заяви, че афро-американците представляват само зашеметяващите 8% от студентската популация. С тези ниски проценти във всички колежи и университети в Съединените щати, колежите сега се събуждат и питат какво могат да направят, за да помогнат за увеличаване на приема на афро-американска общност, като се започне с най-голямата им пречка, изискванията за SAT/ACT.

Този проект има за цел да предостави препоръки за приемната комисия чрез използване на проучвателен анализ на данни и други аналитични инструменти в подкрепа на моите открития. За да постигна целта си успешно, започнах да избирам своите източници на данни. Получих два набора от данни и намерих три външни набора от данни. Двата набора от данни SAT/ACT включваха състоянието, процента на участие и резултатите. Дадените набори от данни осигуриха силен старт, защото вече мога да направя извод кои щати са имали най-добри нива на участие. Въпреки че се съсредоточих върху афро-американската общност, трябваше да знам размера на населението на афро-американската общност в тези щати, защото тогава можех да намеря силни корелации между ниските нива на участие и афро-американската общност.

И така, за да проуча по-задълбочено, намерих размера на населението в проценти от афро-американците и го обединих с дадените набори от данни SAT/ACT. И накрая, намерих набор от данни, който сравнява резултатите от тестовете на всяко състезание в Америка, което е взело SAT или ACT. Следва старателно почистване на набора от данни. Както споменах по-горе, имах обединен набор от данни за почистване. Първо, конвертирах процентите на участие на SAT/ACT в правилните единици. След това премахнах ненужните колони. След това проверих за липсващи стойности в редовете и реших дали тези липсващи стойности могат сериозно да повлияят на данните ми.

След като изчистих данните си, започнах проучвателния анализ на данни (EDA). Намирането на нови таблици, диаграми и графики не се оказа проблем. Една таблица, която предпочитах, точно посочваше колко зле се представят афро-американските ученици на SAT/ACT, особено в сравнение с други раси. Използвах диаграми на разпръскване, които показаха ниските нива на участие на афро-американската общност в щатите. Друга част от EDA, която открих, е „готовността за SAT/ACT сред студентите, готови за колеж“. За пореден път афро-американската раса се представи зле, особено в категорията по математика на изпита.

Моят основен извод за EDA е, че ми помогна да намеря корелации и връзки, които никога не бих видял. Това е като поговорката „Една картина струва 1000 думи“, която моят инструктор обича да затвърждава. Освен това, докато открива нови корелации, EDA помага да оформи тези корелации, които всеки може да намери сам. Така че с EDA, направено правилно, което означава, че осите, заглавията, единиците и етикетите са правилни, това е от полза за мен и всяка публика, която представям.

След EDA следват препоръки и заключения, което се оказва любимата ми част от всеки проект. Радвам се на споделянето, защото това е шанс да имам идея, която може наистина да повлияе на хората или да промени света. Това може да са идеи, за които хората никога не са се сетили и да им помогнат да научат нещо, което не са знаели преди. Освен това препоръките и заключенията отговарят на проблема с твърдението, който е от решаващо значение.

Първата препоръка е колежите/университетите да вземат предвид екологичния и социално-икономически статус на студента. От EDA, който споменах по-горе, който постоянно заявява как афро-американската общност изостава по много различни начини, средата на студента играе жизненоважна роля за тяхната готовност за колеж. Например картата, която използвах в моята презентация, показа как е най-малко вероятно да са готови за колеж в южните щати със семейства с ниски доходи. Не е грешката на студентите, че са родени в семейства с ниски доходи, докато живеят в град с ниски доходи. Понякога училищата нямат лукса да подготвят своите ученици да бъдат готови за колеж, защото това не е в техния бюджет. Ако колежите/университетите разберат това, те биха могли да направят корекции, за да помогнат на повече афроамерикански студенти да станат „готови за колеж“.

Предлагам решението за корекциите на колежите/университетите, които те могат да направят, е да създадат или спонсорират достъпна подготовка за колеж за SAT/ACT. Тези програми трябва да са насочени към ученици от средно училище и нагоре. Това ще даде на афроамериканските студенти достатъчно време, за да станат колежани, готови да им помогнат да се справят добре на изпита.

Така че, за да отговоря официално на моето изложение на проблема по-горе, расата/етническата принадлежност има значителен и съществен ефект върху SAT/ACT резултатите, представянето, участието и средата в сравнение с техните бели колеги. Освен това институциите трябва да премахнат предположението, че всеки има равен достъп до подходящо образование, особено по раса. Всички мои данни са съсредоточени около тези факти. Разбирането на тази препоръка трябва да вдъхнови приемните комисии да променят своите изисквания за SAT/ACT или дори да ги премахнат, докато афро-американската общност не подобри готовността си за изпитите.

И накрая, ефектът от този проект върху мен ми помогна да видя моята общност, афроамериканската общност, в нова светлина. Изключително се насладих на процеса, който ме доведе до моите заключения. Това наистина ме кара да се чувствам като истински учен по данни. Надявам се, че всеки, който прегледа моя проект, ще се промени малко отвътре и ще продължи да носи факела на приобщаването и разнообразието във всяка институция или индустрия.