Как можете да настроите фино модела GPT-3.5 Turbo на OpenAI за изпълнение на нови задачи, използвайки вашите персонализирани данни

Бях развълнуван, когато получих имейл от OpenAI, който съобщава за възможността за фина настройка на ChatGPT. Актуализацията дойде в отговор на исканията на разработчици и фирми, които искат да персонализират модела, за да отговарят по-добре на техните специфични изисквания. Чрез използването на тази фина настройка вече е възможно да се подобри управляемостта, да се постигне по-последователно форматиране на изхода и да се установи желан персонализиран тон. Друг забележителен аспект е, че потребителите могат да изпращат по-кратки подкани без забележим спад в производителността.

Ето какво казва OpenAI в техния блог за разработка [1].

Тази актуализация дава възможност на разработчиците да персонализират модели, които се представят по-добре за техните случаи на употреба, и да изпълняват тези персонализирани модели в мащаб. Ранните тестове показаха, че фино настроена версия на GPT-3.5 Turbo може да съвпадне или дори да надмине базовите възможности на ниво GPT-4 при определени тесни задачи. Както при всички наши API, данните, изпратени във и извън API за фина настройка, са собственост на клиента и не се използват от OpenAI или друга организация за обучение на други модели. — Андрю Пенг и др., OpenAI

В тази статия ще демонстрирам как използвах текст от моите статии в Medium като тренировъчни и тестови данни за автоматично конвертиране на обикновен текст във формат Markdown. Преди да опиша експеримента, ще ви дам малко предистория за ChatGPT.

Заден план

AI моделът, известен като ChatGPT, беше представен през ноември 2022 г. [2]. Това беше първият публичен чатбот, който OpenAI пусна и аз съм писал за него няколко пъти тук в Medium. Моделът работи толкова добре, колкото общ чатбот, но има няколко ограничения. Например прекъсването на обучението му беше септември 2021 г., така че не знае директно за никаква нова информация оттогава. Използването на плъгини на браузъра за извличане и разширяване на данните на модела е възможно, но в момента това е бавно и тромаво.

По-добър начин за вливане на нова информация и умения в ChatGPT е използването на API за фина настройка на OpenAI. Фината настройка на ChatGPT чрез API предлага подобрени резултати в сравнение с редовното подсказване. Позволява обучение на повече примери, отколкото подканата може да обработи, води до по-кратки подкани, които спестяват токени, и води до по-бързо...