Что такое ИИ? Все, что вам нужно знать об искусственном интеллекте

Руководство по искусственному интеллекту, от машинного обучения и общего ИИ до нейронных сетей.

ЧТО ТАКОЕ ИСКУССТВЕННЫЙ ИНТЕЛЛЕКТ (ИИ)?

Смотря кого спросить.

Еще в 1950-х годах отцы области Мински и Маккарти описывали искусственный интеллект как любую задачу, выполняемую программой или машиной, которая, если бы она была выполнена человеком, должна была бы применить интеллект для ее выполнения.

Современные определения того, что означает создание интеллекта, немного более конкретны. Франсуа Шоле, исследователь искусственного интеллекта в Google и создатель библиотеки программного обеспечения для машинного обучения Keras, сказал, что интеллект связан со способностью системы адаптироваться и импровизировать в новой среде, обобщать свои знания и применять их в незнакомых сценариях.

«Интеллект – это эффективность, с которой вы приобретаете новые навыки в задачах, к которым раньше не готовились», – сказал он .

«Интеллект – это не сам навык, это не то, что вы можете делать, а то, насколько хорошо и насколько эффективно вы можете изучать новые вещи».

Это определение, согласно которому современные системы на базе ИИ, такие как виртуальные помощники, можно охарактеризовать как продемонстрировавшие «узкий ИИ»; способность обобщать свои тренировки при выполнении ограниченного набора задач, таких как распознавание речи или компьютерное зрение.

Как правило, системы искусственного интеллекта демонстрируют по крайней мере некоторые из следующих видов поведения, связанных с человеческим интеллектом: планирование, обучение, рассуждение, решение проблем, представление знаний, восприятие, движение и манипулирование и, в меньшей степени, социальный интеллект и творчество.

КАКОЕ ИСПОЛЬЗОВАНИЕ AI?

Сегодня ИИ повсеместно используется, чтобы рекомендовать, что вам следует покупать дальше в Интернете, чтобы понимать, что вы говорите виртуальным помощникам, таким как Amazon Alexa и Apple Siri , чтобы распознать, кто и что находится на фотографии , чтобы обнаружить спам или обнаружить кредитную карту. мошенничество .

КАКИЕ БЫВАЮТ ТИПЫ ИИ?

На очень высоком уровне искусственный интеллект можно разделить на два основных типа: узкий ИИ и общий ИИ.

Как упоминалось выше, узкий ИИ – это то, что мы видим сегодня вокруг нас в компьютерах: интеллектуальные системы, которых научили или научились выполнять определенные задачи, не будучи явно запрограммированными, как это делать.

Этот тип машинного интеллекта проявляется в распознавании речи и языка виртуального помощника Siri на Apple iPhone, в системах распознавания зрения на беспилотных автомобилях или в механизмах рекомендаций, которые предлагают продукты, которые могут вам понравиться, на основе того, что вы купил в прошлом. В отличие от людей, эти системы можно научить или научить выполнять только определенные задачи, поэтому их называют узким ИИ.

НА ЧТО СПОСОБЕН УЗКИЙ ИИ?

Существует огромное количество новых приложений для узкого ИИ: интерпретация видеопотоков с дронов, выполнение визуальных проверок инфраструктуры, такой как нефтепроводы, организация личных и деловых календарей, ответы на простые запросы в службу поддержки клиентов, координация с другими интеллектуальными системами для выполнения такие задачи, как бронирование отеля в подходящее время и в подходящем месте, помощь радиологам в обнаружении потенциальных опухолей с помощью рентгеновских лучей, отметка несоответствующего контента в Интернете, обнаружение износа лифтов на основе данных, собранных устройствами IoT, создание трехмерной модели мира со спутника изображения , список можно продолжать и продолжать.

Новые приложения этих обучающих систем появляются постоянно. Разработчик видеокарт Nvidia недавно представила систему Maxine на основе искусственного интеллекта , которая позволяет людям совершать видеозвонки хорошего качества практически независимо от скорости их подключения к Интернету. Система сокращает полосу пропускания, необходимую для таких вызовов, в 10 раз, поскольку не передает полный видеопоток через Интернет, а вместо этого анимирует небольшое количество статических изображений вызывающего абонента таким образом, чтобы воспроизводить выражения лиц и движения вызывающих абонентов. в реальном времени и быть неотличимым от видео.

Однако, несмотря на большой неиспользованный потенциал этих систем, иногда амбиции в отношении технологии превосходят реальность. В качестве примера можно привести беспилотные автомобили, в основе которых лежат системы на базе искусственного интеллекта, такие как компьютерное зрение. Компания по производству электромобилей Tesla немного отстает от первоначального графика генерального директора Илона Маска, когда система автопилота автомобиля будет модернизирована до “полного автономного вождения” за счет более ограниченных возможностей системы вспомогательного вождения, при этом опция полного автономного вождения только недавно была запущена в избранная группа опытных водителей в рамках программы бета-тестирования.

ЧТО УМЕЕТ ОБЫЧНЫЙ ИИ?

Общий ИИ очень отличается и представляет собой тип адаптируемого интеллекта, встречающийся у людей, гибкую форму интеллекта, способную учиться выполнять совершенно разные задачи, от стрижки до создания электронных таблиц или рассуждений по широкому кругу тем на основе накопленный опыт. Это тот вид ИИ, который чаще всего встречается в фильмах, таких как HAL в 2001 году или Скайнет в Терминаторе, но которого сегодня не существует, и эксперты по ИИ жестко расходятся во мнениях, как скоро это станет реальностью.

Опрос, проведенный среди четырех групп экспертов в 2012-2013 гг. Исследователями искусственного интеллекта Винсентом Мюллером и философом Ником Бостромом, показал 50% вероятность того, что общий искусственный интеллект (AGI) будет разработан в период между 2040 и 2050 годами, а к 2075 году вырастет до 90%. Группа пошла еще дальше, предсказав, что так называемый « суперинтеллект », который Бостром определяет как «любой интеллект, который значительно превосходит когнитивные способности человека практически во всех областях, представляющих интерес», – ожидалось примерно через 30 лет после достижения AGI.

Однако недавние оценки экспертов по ИИ более осторожны. Пионеры в области современных исследований искусственного интеллекта, такие как Джеффри Хинтон, Демис Хассабис и Янн ЛеКун,  говорят, что общество еще далеко от разработки AGI . Учитывая скептицизм лидеров в области современного искусственного интеллекта и совершенно иной характер современных узких систем искусственного интеллекта по сравнению с искусственным интеллектом, возможно, нет оснований опасаться, что общество будет разрушено общим искусственным интеллектом в ближайшем будущем.

Тем не менее, некоторые эксперты в области искусственного интеллекта считают такие прогнозы чрезвычайно оптимистичными, учитывая наше ограниченное понимание человеческого мозга, и полагают, что до ОИИ еще далеко.

КАКОВЫ ПОСЛЕДНИЕ ВЕХИ В РАЗВИТИИ ИИ?

В то время как современный узкий ИИ может быть ограничен выполнением определенных задач, в рамках своей специализации эти системы иногда способны на сверхчеловеческую производительность, а в некоторых случаях даже демонстрируют превосходную креативность – черту, которую часто считают по сути человеческой.

Было сделано слишком много прорывов, чтобы составить окончательный список, но некоторые основные моменты включают: в 2009 году Google показал, что его беспилотная Toyota Prius может совершить более 10 поездок по 100 миль каждая, что поставило общество на путь перехода к беспилотным автомобилям. транспортных средств.

watson.jpg
IBM Watson соревнуется в Jeopardy! 14 января 2011 г.Изображение: IBM

В 2011 году компьютерная система IBM Watson попала в заголовки газет во всем мире, когда выиграла викторину в США Jeopardy! , победив двух лучших игроков этого шоу. Чтобы выиграть шоу, Watson использовал обработку естественного языка и аналитику в огромных хранилищах данных, которые он обрабатывал, чтобы отвечать на вопросы, заданные человеком, часто за доли секунды.

В 2012 году еще один прорыв возвестил о том, что ИИ способен решать множество новых задач, которые ранее считались слишком сложными для любой машины. В том же году система AlexNet одержала решительную победу в конкурсе ImageNet Large Scale Visual Recognition Challenge. Точность AlexNet была такова, что он вдвое сократил количество ошибок по сравнению с конкурирующими системами в конкурсе на распознавание изображений.

Производительность AlexNet продемонстрировала мощь обучающих систем, основанных на нейронных сетях, модели машинного обучения, которая существовала на протяжении десятилетий, но наконец реализовала свой потенциал благодаря усовершенствованиям архитектуры и скачкам в параллельной вычислительной мощности, которые стали возможными благодаря закону Мура. В том году в заголовках газет также попало умение систем машинного обучения реализовать компьютерное зрение: Google обучил систему распознавать фаворита Интернета: изображения кошек .

Следующей демонстрацией эффективности систем машинного обучения, привлекшей внимание общественности, стала победа в 2016 году ИИ Google DeepMind AlphaGo над человеческим гроссмейстером в древней китайской игре го, сложность которой ставила компьютеры в тупик на протяжении десятилетий. Го имеет около 200 возможных ходов за ход по сравнению с 20 в шахматах. В ходе игры в го существует так много возможных ходов, что предварительный поиск каждого из них для определения наилучшего варианта слишком затратен с вычислительной точки зрения. Вместо этого AlphaGo научилась играть в игру, взяв ходы, выполненные людьми-экспертами в 30 миллионах игр го, и вводили их в нейронные сети с глубоким обучением.

Обучение этих сетей глубокого обучения может занять очень много времени, требуя приема и повторения огромных объемов данных, поскольку система постепенно уточняет свою модель для достижения наилучшего результата.

Однако совсем недавно Google усовершенствовал процесс обучения с помощью AlphaGo Zero , системы, которая играла против себя «совершенно случайные» игры, а затем извлекала уроки из результатов. Генеральный директор Google DeepMind Демис Хассабис также представил новую версию AlphaGo Zero, в которой освоены шахматы и сёги.

И ИИ продолжает стремительно преодолевать новые рубежи:  система, обученная OpenAI, победила лучших игроков мира в матчах один на один в многопользовательской онлайн-игре Dota 2.

В том же году OpenAI создал агентов ИИ, которые изобрели свой  собственный язык, чтобы сотрудничать и более эффективно достигать своей цели, а вскоре последовали агенты Facebook по обучению переговорам и даже лжи .

2020 год также стал годом, когда система искусственного интеллекта, казалось, получила способность писать и говорить как человек практически на любую тему, о которой вы только можете подумать.

Рассматриваемая система, известная как Generative Pre-Training Transformer 3 или сокращенно GPT-3, представляет собой нейронную сеть, обученную на миллиардах англоязычных статей, доступных в открытом Интернете.

Вскоре после того, как некоммерческая организация OpenAI сделала его доступным для тестирования, Интернет загорелся способностью GPT-3 создавать статьи практически по любой теме, которая была передана в него, статьи, которые на первый взгляд часто было трудно найти. отличить от написанных человеком. Столь же впечатляющие результаты были получены и в других областях, с его способностью убедительно отвечать на вопросы по широкому кругу тем и даже сойти за начинающего программиста JavaScript .

Но хотя многие статьи, созданные с помощью GPT-3, выглядели правдоподобно, дальнейшее тестирование показало, что сгенерированные предложения часто не проходят проверку, предлагая на первый взгляд правдоподобные, но запутанные утверждения, а иногда и откровенную чушь .

По-прежнему существует значительный интерес к использованию понимания естественного языка модели в качестве основы для будущих сервисов, и он доступен избранным разработчикам для встраивания в программное обеспечение через бета-API OpenAI . Он также будет включен в будущие сервисы, доступные через облачную платформу Microsoft Azure .

Возможно, самый яркий пример потенциала ИИ появился в конце 2020 года, когда нейронная сеть Google AlphaFold 2 продемонстрировала результат, который некоторые назвали достойным Нобелевской премии по химии.

Система была сосредоточена на способности смотреть на строительные блоки белка, известные как аминокислоты, и выводить, что трехмерная структура белка может иметь огромное влияние на скорость понимания болезней и разработки лекарств. В конкурсе «Критическая оценка предсказания структуры белка» AlphaFold 2 смогла определить трехмерную структуру белка с точностью, сопоставимой с кристаллографией, золотым стандартом для убедительного моделирования белков.

В отличие от кристаллографии, для получения результатов которой требуются месяцы, AlphaFold 2 может моделировать белки за часы. Поскольку трехмерная структура белков играет такую ​​важную роль в биологии человека и болезнях, такое ускорение было объявлено значительным прорывом для медицинской науки , не говоря уже о потенциальных приложениях в других областях, где ферменты используются в биотехнологиях.

ЧТО ТАКОЕ МАШИННОЕ ОБУЧЕНИЕ?

Практически все упомянутые до сих пор достижения связаны с машинным обучением, подмножеством ИИ, на которое приходится подавляющее большинство достижений в этой области за последние годы. Когда сегодня говорят об ИИ, они обычно говорят о машинном обучении.

Проще говоря, машинное обучение – это когда компьютерная система учится выполнять задачу, а не программируется, как это сделать, в настоящее время переживает возрождение. Это описание машинного обучения восходит к 1959 году, когда оно было придумано Артуром Сэмюэлем, пионером в этой области, который разработал одну из первых в мире самообучающихся систем, Программу игры Сэмюэля Шеккерс.

Для обучения этим системам передаются огромные объемы данных, которые они затем используют, чтобы научиться выполнять конкретную задачу, например, понимать речь или подписывать фотографии. Качество и размер этого набора данных важны для построения системы, способной точно выполнять поставленную перед ней задачу. Например, если вы создавали систему машинного обучения для прогнозирования цен на жилье, обучающие данные должны включать не только размер собственности, но и другие важные факторы, такие как количество спален или размер сада.

ЧТО ТАКОЕ НЕЙРОННЫЕ СЕТИ?

Ключом к успеху машинного обучения являются нейронные сети. Эти математические модели могут настраивать внутренние параметры, чтобы изменять то, что они выводят. Во время обучения нейронная сеть получает наборы данных, которые учат ее тому, что она должна выдавать при представлении определенных данных. Говоря конкретно, в сеть могут подаваться изображения в оттенках серого с числами от нуля до 9, а также строка двоичных цифр – нулей и единиц – которые указывают, какое число отображается на каждом изображении в градациях серого. Затем сеть будет обучаться, регулируя свои внутренние параметры, пока она не классифицирует число, показанное на каждом изображении, с высокой степенью точности. Затем эту обученную нейронную сеть можно использовать для классификации других изображений в оттенках серого с числами от нуля до 9.

Структура и функционирование нейронных сетей очень слабо основаны на связях между нейронами мозга. Нейронные сети состоят из взаимосвязанных слоев алгоритмов, которые передают данные друг в друга и которые можно обучить выполнять определенные задачи, изменяя важность, приписываемую данным, когда они передаются между этими уровнями. Во время обучения этих нейронных сетей веса, присваиваемые данным по мере их прохождения между слоями, будут по-прежнему изменяться до тех пор, пока выходной сигнал нейронной сети не станет очень близок к желаемому, и в этот момент сеть «научится» переносить из конкретной задачи. Желаемый результат может быть любым: от правильной маркировки фруктов на изображении до прогнозирования отказа лифта на основе данных его датчика.

Подмножество машинного обучения – это глубокое обучение, при котором нейронные сети расширяются до разветвленных сетей с большим количеством значительных уровней, которые обучаются с использованием огромных объемов данных. Именно эти глубокие нейронные сети способствовали нынешнему скачку в способности компьютеров выполнять такие задачи, как распознавание речи и компьютерное зрение.

SEE:  Руководство ИТ-лидера по глубокому обучению  (Tech Pro Research)

Существуют разные типы нейронных сетей с разными сильными и слабыми сторонами. Рекуррентные нейронные сети (RNN) представляют собой тип нейронной сети, особенно хорошо подходящей для обработки естественного языка (NLP) – понимания значения текста – и распознавания речи, в то время как сверточные нейронные сети имеют свои корни в распознавании изображений и имеют столь же разнообразное применение, как рекомендательные системы и НЛП. Дизайн нейронных сетей также развивается, и исследователи совершенствуют более эффективную форму глубокой нейронной сети, называемую долгой краткосрочной памятью или LSTM – тип архитектуры RNN, используемый для таких задач, как NLP, и для прогнозирования фондового рынка, что позволяет ей работать. достаточно быстро, чтобы его можно было использовать в системах по запросу, таких как Google Translate.

ai-ml-neural-network.jpg
Структура и обучение глубоких нейронных сетей.Изображение: Nuance

КАКИЕ ЕЩЕ ТИПЫ ИИ?

Еще одна область исследований ИИ – это эволюционные вычисления , которые заимствованы из теории естественного отбора Дарвина и рассматривают генетические алгоритмы, которые претерпевают случайные мутации и комбинации между поколениями в попытке найти оптимальное решение данной проблемы.

Этот подход даже использовался для разработки моделей ИИ, эффективно используя ИИ для создания ИИ. Такое использование эволюционных алгоритмов для оптимизации нейронных сетей называется нейроэволюцией и может сыграть важную роль в разработке эффективного ИИ, поскольку использование интеллектуальных систем становится все более распространенным, особенно потому, что спрос на специалистов по данным часто превышает предложение. Этот метод был продемонстрирован лабораторией Uber AI Labs, которая выпустила статьи об использовании генетических алгоритмов для обучения глубоких нейронных сетей для решения задач обучения с подкреплением.

Наконец, существуют экспертные системы , в которых компьютеры запрограммированы с помощью правил, которые позволяют им принимать серию решений на основе большого количества входных данных, позволяя этой машине имитировать поведение человека-эксперта в определенной области. Примером этих систем, основанных на знаниях, может быть, например, система автопилота, управляющая самолетом.

ЧТО СПОСОБСТВУЕТ ВОЗРОЖДЕНИЮ ИИ?

Как указано выше, самые большие достижения в исследованиях искусственного интеллекта за последние годы были сделаны в области машинного обучения, в частности в области глубокого обучения.

Частично это было вызвано легкостью доступа к данным, но тем более резким увеличением мощности параллельных вычислений, в течение которого использование кластеров графических процессоров (ГП) для обучения систем машинного обучения стало более распространенным.

Эти кластеры не только предлагают гораздо более мощные системы для обучения моделей машинного обучения, но и теперь широко доступны в виде облачных сервисов через Интернет. Со временем крупные технологические компании, такие как Google, Microsoft и Tesla, перешли на использование специализированных чипов, предназначенных как для работы, так и для обучения моделей машинного обучения.

Примером одного из этих пользовательских чипов является Tensor Processing Unit (TPU) Google, последняя версия которого ускоряет скорость, с которой полезные модели машинного обучения, построенные с использованием программной библиотеки Google TensorFlow, могут выводить информацию из данных, а также скорость которым их можно обучить.

Эти чипы используются не только для обучения моделей DeepMind и Google Brain, но и моделей, лежащих в основе Google Translate и распознавания изображений в Google Фото, а также сервисов, которые позволяют общественности создавать модели машинного обучения с использованием Google TensorFlow Research. Облако . Третье поколение этих чипов было представлено на конференции Google I / O в мае 2018 года и упаковано в центры машинного обучения, называемые модулями, которые могут выполнять более ста тысяч триллионов операций с плавающей запятой в секунду (100 петафлопс). Эти текущие обновления TPU позволили Google улучшить свои услуги, основанные на моделях машинного обучения, например вдвое сократить время, необходимое для обучения моделей, используемых в Google Translate .

КАКИЕ ЭЛЕМЕНТЫ МАШИННОГО ОБУЧЕНИЯ?

Как уже упоминалось, машинное обучение является разновидностью ИИ и обычно делится на две основные категории: обучение с учителем и обучение без учителя.

Контролируемое обучение

Распространенный метод обучения систем искусственного интеллекта – обучение их с использованием очень большого количества помеченных примеров. В эти системы машинного обучения поступают огромные объемы данных, которые были аннотированы, чтобы выделить интересующие функции. Это могут быть фотографии, помеченные, чтобы указать, содержат ли они собаку, или письменные предложения с сносками, указывающими, относится ли слово «окунь» к музыке или к рыбе. После обучения система может применять эти метки к новым данным, например к собаке на фотографии, которая только что была загружена.

Этот процесс обучения машины на примере называется контролируемым обучением, и роль маркировки этих примеров обычно выполняют онлайн-сотрудники, работающие на таких платформах, как Amazon Mechanical Turk .

SEE :  Как искусственный интеллект выводит центры обработки вызовов на новый уровень

Для обучения этих систем обычно требуются огромные объемы данных, при этом некоторым системам необходимо просмотреть миллионы примеров, чтобы научиться эффективно выполнять задачу, хотя это становится все более возможным в эпоху больших данных и повсеместного интеллектуального анализа данных. Наборы обучающих данных огромны и растут в размерах  : набор данных Google Open Images содержит около девяти миллионов изображений , а его помеченный видеорепозиторий  YouTube-8M ссылается на семь миллионов помеченных видео. ImageNet , одна из первых баз данных такого типа, насчитывает более 14 миллионов изображений, разделенных на категории. Составленный за два года, его составили почти 50 000 человек, большинство из которых были наняты через Amazon Mechanical Turk, которые проверили, отсортировали и пометили почти миллиард фотографий кандидатов.

В конечном итоге доступ к огромным размеченным наборам данных может оказаться менее важным, чем доступ к большим объемам вычислительной мощности.

В последние годы генеративные состязательные сети ( GAN ) использовались в системах машинного обучения, которые требуют лишь небольшого количества помеченных данных вместе с большим объемом немаркированных данных, которые, как следует из названия, требуют меньше ручной работы для подготовки.

Такой подход мог бы позволить более широкое использование полууправляемого обучения, когда системы могут научиться выполнять задачи с использованием гораздо меньшего количества помеченных данных, чем это необходимо для обучающих систем, использующих обучение с учителем сегодня.

Обучение без учителя

Напротив, обучение без учителя использует другой подход, когда алгоритмы пытаются идентифицировать закономерности в данных, ища сходства, которые можно использовать для категоризации этих данных.

Примером может быть объединение фруктов, которые весят одинаковое количество, или автомобилей с аналогичным объемом двигателя.

Алгоритм не настроен заранее для выбора конкретных типов данных, он просто ищет данные, которые можно сгруппировать по их сходству, например, в Новостях Google каждый день группируются истории на похожие темы.

Обучение с подкреплением

Грубая аналогия обучения с подкреплением – награждение питомца угощением за выполнение трюка. При обучении с подкреплением система пытается максимизировать вознаграждение на основе входных данных, в основном проходя процесс проб и ошибок, пока не достигнет наилучшего возможного результата.

Примером обучения с подкреплением является Deep Q-сеть Google DeepMind, которая использовалась для повышения производительности человека в различных классических видеоиграх . Система получает пиксели из каждой игры и определяет различную информацию, например расстояние между объектами на экране.

Также глядя на счет, достигнутый в каждой игре, система строит модель того, какое действие будет максимизировать счет в различных обстоятельствах, например, в случае прорыва видеоигры, где ракетка должна быть перемещена, чтобы перехватить мяч.

Этот подход также используется в исследованиях робототехники , где обучение с подкреплением может помочь научить автономных роботов оптимальному поведению в реальных условиях.

ai-ml-gartner-hype-cycle.jpg
Многие технологии, связанные с искусственным интеллектом, приближаются или уже достигли «пика завышенных ожиданий» в цикле хайпов Gartner, а вызванный негативной реакцией «впадина разочарования» поджидает.

Добавить комментарий

Ваш адрес email не будет опубликован. Обязательные поля помечены *