Публикации по темата large-language-models

Свързани публикации 'large-language-models'

Въведение в Open LLM Falcon-40B: производителност, данни за обучение и архитектура

Започнете да използвате Falcon-7B, Falcon-40B и техните версии с инструкции „Моделите Falcon“ привлякоха много внимание, откакто бяха пуснати през май 2023 г. Те са каузални големи езикови модели (LLM) или така наречените модели „само за декодер“, много подобни на GPT. Определение: модел на каузален език Моделирането на каузален език включва предсказване на токена, който следва последователност от токени. По време на обучението вниманието на модела е насочено единствено към..

Човешкото съзнание срещу машинното съзнание

Тъй като хората започнаха да твърдят, че някои софтуерни програми или изкуствени машини са придобили или могат да придобият „съзнание“, започнах да се чудя и да си задавам няколко въпроса: „Откъде тези хора знаят?“, „В кой предмет от нашето дълго задължително образование ни се казва какво човешко съзнанието е? Защото със сигурност го пропуснах”, „Как бихме могли да знаем какво е машинно съзнание, ако не сме машини?”. Всичко, което знам е, че този тип знания не са част от никоя стандартна..

Прогнозиране на бъдещи живи запаси с помощта на големи езикови модели в Python.

Прогнозите на фондовия пазар винаги са били предизвикателна задача за инвеститори и търговци. Въпреки това, скорошният напредък в обработката на естествения език и дълбокото обучение отвори нови възможности. В тази статия ще проучим как можем да използваме големи езикови модели и данни от Yahoo Finance, за да правим бъдещи прогнози за цените на акциите с помощта на Python. Съдържание: Разбиране на проблема Събиране на исторически данни за запасите Предварителна обработка на..

Какво е квантуване и дестилация на модели?

ЗАДЕН ПЛАН LLMs (Large Language Models) бързо се разширява, като се използват все по-голям брой параметри за постигане на важни цели: Латентност в реално време Ниска консумация на енергия Висока точност Въпреки това, този ръст в размера и сложността на модела поставя значителни предизвикателства за инфраструктурата и облачния хостинг. Двата основни проблема с внедряването на LLM са: Твърде голям за хардуер: Тъй като целевите крайни устройства нямат достатъчно памет за..

Най-обещаващите LLM, налични в търговската мрежа

Въведение Големите езикови модели (LLM) са вид изкуствен интелект, който може да генерира текст, да превежда езици и да отговаря на въпроси по информативен начин. Те са обучени на огромни количества данни и могат да се научат да изпълняват голямо разнообразие от задачи. В търговската мрежа има редица LLMs и те стават все по-популярни. Някои от най-обещаващите LLMs, предлагани в търговската мрежа, включват: Bard е голям езиков модел от Google AI. Може да генерира текст, да..

Компоненти на LLM (Част 3: Обучение по модел)

Тази статия е достъпна и под формата на видео на адрес: https://www.youtube.com/watch?v=bee1cIl7Y8w В предишната статия разгледахме масивната, базирана на трансформатори архитектура на LLM, сега ще се потопим в стратегиите за обучение, използвани за конфигуриране на техните параметри. Обучението за LLM обикновено е многоетапно и започва с общо предварително обучение върху многодомейнен корпус, като се използва неконтролирана цел. Цели на предварителната подготовка: Досега..

Агенти, ориентирани към документи: Пътуване с векторни бази данни, LLM, Langchain, FastAPI и Docker

Използване на ChromaDB, Langchain и ChatGPT: Подобрени отговори и цитирани източници от големи бази данни с документи Въведение Агентите, ориентирани към документи, започват да навлизат в бизнес пейзажа. Компаниите все повече използват тези инструменти, за да се възползват от вътрешната документация, подобрявайки своите бизнес процеси. Скорошен доклад на McKinsey [1] подчертава тази тенденция, като предполага, че генеративният AI може да даде тласък на световната икономика с $2,6–4,4..