Видимая часть айсберга: Искусственный интеллект - Часть 2

В первой части моей статьи я говорил о приложениях, которые сыграли важную роль в истории искусственного интеллекта, и начал разговор о ChatGPT. Во второй части моей статьи я продолжу объяснять принцип работы ChatGPT, расскажу об областях его применения и о возможных рисках.

Принцип работы

Мы можем встретить ChatGPT в повседневной жизни повсюду! Но что лежит в основе этой технологии? Принцип работы данного алгоритма заключается в прогнозировании следующего слова. Языковая модель берет последовательность слов и определяет следующее слово, используя принцип вероятностного распределения. Длина вводимой последовательности ограничена размером контекстного окна конкретной языковой модели (например, в ChatGPT установлено ограничение в 4096 слов).

Как видно на изображении выше, когда мы пишем "The sky is" (Небо), алгоритм определяет, что с наибольшей вероятностью следующим словом будет "blue" (синее), и продолжает предложение. Поскольку он предсказывает следующее слово, он фактически отвечает на каждый вопрос, который мы задаем, продолжая предложение.

Теперь давайте рассмотрим алгоритм, предсказывающий следующее слово, с технической точки зрения. В этих моделях содержится много параметров. То, что мы называем параметрами, на самом деле является весами нейронной сети. Например, в модели с открытым исходным кодом llama-2–70b, выпущенной Meta, содержится 70 миллиардов параметров. Учитывая, что каждый параметр занимает 2 байта, размер такого файла с параметрами составляет 140 гигабайт. Для этих параметров требуется как минимум 6000 графических процессоров (GPU) для сжатия 10 терабайт данных, собранных из интернета. На это понадобится 12 дней и 2 миллиона долларов.

Основатель OpenAI Сэм Альтман упоминал в интервью, что в процессе обучения GPT-4 на GPU было потрачено более 100 миллионов долларов! Утверждается, что у GPT-4 1 триллион параметров, но это пока только предположения, так как OpenAI не раскрывает все количественные данные в связи с обучением GPT-4.

Точность моделей ChatGPT - это крайне важный момент, на который необходимо обратить внимание. Поскольку если эти модели не направляются правильными командами (подсказками), алгоритм выдает неправильную информацию, называемую галлюцинациями. Подсказки используются для того, чтобы установить границы, определяющие какой тип текста или данных будет использоваться для обучения модели и ответы какого вида она будет генерировать. Важность инженерии подсказок заключается в том, что с ее помощью можно получить от моделей ИИ желаемые результаты, при этом снижая количество нежелательных результатов или устраняя их полностью. Правильно разработанные подсказки могут сделать выводы модели более предсказуемыми, сводя к минимуму нежелательные явления и помогая достигать более подходящих и последовательных результатов для определенной задачи или области. Поэтому предоставление максимально подробной информации при формулировании вопросов для ChatGPT, по возможности с примерами, повышает точность полученных результатов и снижает вероятность того, что модель даст нереалистичные (невероятные) ответы.

Применение и примеры использования

В настоящее время данная технология используется множеством приложений. Самые известные из них: Google BARD, OpenAI ChatGPT, Google Gemini и Meta Grok. Они были выпущены разными компаниями, но служат одной цели. Мы можем использовать эти и многие другие приложения во многих сферах жизни. С их помощью мы можем решать личные задачи, такие как написание электронных и сопроводительных писем, составление списков, создание изображений и подробное описание изображений, программирование, составление конспектов и рефератов, написание стихов и текстов песен.

Компании могут интегрировать ChatGPT в свои системы обслуживания и поддержки клиентов, чтобы отвечать на вопросы пользователей или решать их проблемы. Начав сотрудничать с OpenAI, компания «Microsoft» также начала использовать технологию OpenAI в качестве своего алгоритма. Ожидается, что недавно анонсированное компанией «Microsoft» приложение Copilot 365, которое интегрирует искусственный интеллект во все инструменты Office 365, позволит упростить многие рабочие процессы.

Разговаривая о том, как компании извлекают выгоду из искусственного интеллекта, я не могу не упомянуть наши приложения искусственного интеллекта в Borusan Cat, которые входят в число технологий, поддерживающих нашу проактивную бизнес-модель 😊 С нашей целью компании "Мы Создаем Решения Для Лучшего Мира" для нас очень важно использовать технологии, чтобы быть хорошими людьми в этом мире. В соответствии с этим мы используем искусственный интеллект как в собственных бизнес-процессах, так и в решениях, которые мы предлагаем нашим заказчикам.

С нашим приложением искусственного интеллекта, Müneccim, которое предсказывает отказы в машинах до их возникновения, мы цифровизируем традиционные процессы и играем ведущую роль в трансформации нашей отрасли. В этом приложении, обрабатывая данные с машин с помощью алгоритмов, мы можем точно предсказать, какие машины нуждаются в проверке сервиса и имеют потенциал для поломок. Мы предлагаем наше приложение искусственного интеллекта "Ухо Мастера", которое может обнаруживать неисправности, прослушивая звук машин всего за 30 секунд, через наше супер-приложение, Boom360, нашим заказчикам. А также, используя наш незаменимый механизм рекомендаций, мы предугадываем другие детали, которые заказчики могут приобрести вместе с основными запчастями через Boom360, и предлагаем им соответствующие рекомендации. Наш алгоритм искусственного интеллекта, RFMS, предсказывает заказчиков, которые склонны к покупке машин, и поддерживает наших друзей-консультантов по продажам.

Не могу не упомянуть, как гордо иметь наше использование технологий искусственного интеллекта в наших операциях в качестве примера из практики на Harvard Business School!

Риски

Технологии могут приносить, как пользу, так и вред, в зависимости от того, как они используются. В связи с возможным вредом возникают опасения касательно конфиденциальности корпоративных или личных данных. Вам нужно убедиться в том, что приложение, которое вы используете, не будет сохранять или использовать введенные вами данные. Как я уже говорил, поскольку модели реагируют на ваши команды, задав недостаточно ясный вопрос и не указав нужные детали, вы можете получить неправильную информацию. Увеличивается количество мошеннических действий с использованием таких технологий, как клонирование голоса и изображений с помощью генеративного ИИ. В некоторых областях нам становится все сложнее понять, что было создано искусственным интеллектом.

Возможно, я написал статью, которую вы сейчас читаете, с помощью ChatGPT, кто знает 😊

Большое спасибо вам за то, что уделили время и прочитали статью!

ИСТОЧНИКИ:

https://www.coursera.org/learn/generative-ai-for-everyone/lecture/u2EQ9/automation-potential-across-sectors
https://economicgraph.linkedin.com/content/dam/me/economicgraph/en-us/PDF/future-of-work-report-ai-november-2023.pdf
https://content.dataiku.com/llm-starter-kit
https://memsql.wistia.com/medias/tck1f3clzj?campaignid=701UJ000000pYIzYAM
https://barissglc.medium.com/llm-large-language-models-nedir-b%C3%BCy%C3%BCk-dil-modellerine-k%C4%B1sa-bir-giri%C5%9F-9872ce8523af
https://memsql.wistia.com/medias/xqtu6j46y0
https://www.youtube.com/watch?v=UU1WVnMk4E8
https://www.youtube.com/watch?v=zjkBMFhNj_g&t=2s
https://on24static.akamaized.net/event/43/71/52/4/rt/1/documents/resourceList1699896189333/llmdevdaysession2final1699896189333.pdf
https://on24static.akamaized.net/event/43/71/54/9/rt/1/documents/resourceList1699985599696/llmdevdaysession41699985599696.pdf
https://on24static.akamaized.net/event/43/71/30/0/rt/1/documents/resourceList1700153986852/llmdevdaysession1stakeholderreviewdt202311151700153986852.pdf
https://nvdam.widen.net/s/rvsgdxpfkz/dli-generative-ai-llm-learning-path-2740963
https://www.deeplearning.ai/short-courses/chatgpt-prompt-engineering-for-developers/
https://learn.microsoft.com/tr-tr/microsoft-365-copilot/microsoft-365-copilot-overview
https://www.youtube.com/watch?v=EEhgiHnnHXg

Yasin Dinç

В течение 14 лет он работал над различными темами в области искусственного интеллекта и науки о данных, а с 2019 года работает в компании Borusan Cat над созданием искусственного интеллекта. Он увлекается автоспортом, любит читать психоанализ и знакомиться с новыми технологиями, работая с данными.