Докато изкуственият интелект става по-умен, като изпива всички знания някъде в пещерата си, нашите „тъпи“ системи вече използват знания, съхранени като „данни“.

Преди да се присъединим към търсенето на това скрито знание, нека се споразумеем за няколко работни дефиниции.

Данните са взаимосвързани факти за обект или група от обекти. Обектът може да бъде обект, концепция или комбинация, а данните описват различни аспекти или атрибути на този обект по конкретен детерминистичен начин. Знанието, от друга страна, е основен модел или основна формула, която обобщава и представя този огромен набор от обекти, така че фактите за нови или невиждани обекти могат да бъдат оценени или прогнозирани.

Объркването между данни и знания започва, защото и двете трябва да се съхраняват в организирано хранилище - система за управление на база данни, например.

И принципът на организиране на това хранилище в крайна сметка е най-интересната дискусия, а не приложението на всичко, което се съхранява там. Тази размита линия между данни и знания става още по-размита, когато автоматизираните системи, които използват това хранилище, също не правят достатъчно ясна разлика между това как данните и знанията се използват по различен начин.

Например, система за управление на клиенти ще получи достъп до адреса на клиента (данните) и отстъпката, която ще бъде приложена към този географски регион (знание) в едно и също извикване на „база данни“. Формулата, използвана за изчисляване на крайната цена, е вградена в софтуера на тази система за управление на клиенти. Тази формула е друго ниво на знание, вградено в системата, но повечето ще се съгласят, че формулата за ценообразуване не е данни в класическия смисъл на нейното значение.

В примера по-горе повечето хора ще се съгласят, че клиентският адрес е данни, а формулата за ценообразуване е знание (в някакъв абстрактен смисъл), но със сигурност ще има дебати за това къде да се постави регионалната отстъпка. Повечето ще твърдят, че регионалната отстъпка е свойство на предварително дефиниран обект, наречен регион - и следователно е част от данните.

Но малцинство може да възрази, че тази отстъпка е предварително определена и всъщност получена чрез прилагане на известно знание – може би усещане на маркетинг мениджър или някакъв сложен статистически анализ, направен другаде, който предвижда правилната отстъпка, която да се приложи, за да се стимулира решението за покупка.

Така че тази цифра на отстъпката, съхранена в базата данни спрямо региона, всъщност е съхранена част от знанието, създадено другаде в по-ранен момент.

Обобщавайки, клиентският адрес е данни, защото не е стойност, получена от експерти (хора или машини). Формулата за ценообразуване е знание, защото е общ модел или алгоритъм, който може да се приложи към всички клиенти. А регионалната отстъпка е предварително създадено „знание“, което случайно се съхранява в система от бази данни за лесен достъп.

След като това разграничение между данни и знания стане ясно, няма нужда да чакате всезнаещият, всевиждащ ИИ да дойде натоварен до хрилете със знания. Няма нужда да чакате тези огромни така наречени трансформационни проекти. Нека просто добавим повече знания към това, което вече имаме, за да станем по-умни. Това е историята на човечеството и вероятно ще бъде историята на машинния вид.