Системы искусственного интеллекта: как работает машинное обучение?

Системы искусственного интеллекта являются фундаментальным компонентом процесса оцифровки, который полностью меняет наше общество. То, что несколько лет назад считалось возможным только в фильме научной фантастики, теперь это реальность: мы разговариваем с компьютерами, телефоны показывают нам самый быстрый маршрут до ближайшей заправочной станции, и наши часы знают, достаточно ли мы физически активны. Технология становится умнее, а исследователи, инженеры и программисты берут на себя роль учителя, объясняя компьютерам, как учиться самостоятельно.


Машинное обучение не только интересно для науки и для ИТ-компаний, таких как Google и Microsoft: даже мир онлайн-маркетинга может измениться благодаря система искусственного интеллекта. В этой статье мы объясняем эволюцию так называемого искусственного интеллекта (AI) за последние годы: что мы имеем в виду под машинным обучением? Какие существуют методы машинного обучения? Наконец, почему маркетологи сосредоточены на системах самообучения?

История самообучающихся систем

Роботы и автоматы были частью жизни людей в течение нескольких сотен веков. Множество авторов фантастической литературы обращались к вопросу об искусственном интеллекте, и даже сегодня роботы являются увлекательными героями книг, фильмов и видеоигр. Связь человека с мышлением всегда колебалась между страхом и увлечением.

 

Реальные исследования машинного обучения начались только в 50-х годах прошлого века: эпоха, когда компьютеры находились в зачаточном состоянии, а искусственный интеллект был далеким сном. Ученые, такие как Томас Байес, Адриен-Мари Лежандр и Пьер-Симон Лаплас заложили основу для будущих исследований в течение двух предыдущих столетий, концепция машины, способной к обучению, и только в 50-х годах наконец-то материализовалась с работой Алана Тьюринга.

«В этом случае следует признать, что продвижение машины не было предусмотрено во время ввода первоначальных инструкций. Это было бы похоже на то, что студент многому научился у учителя, но добавил еще больше с его работой. Когда это происходит, человек вынужден признать, что машина показывает признаки интеллекта ».

 

Алан Тьюринг в своей лекции в 1947 году

В 1950-х годах Тьюринг разработал тест, который известен сегодня: это своего рода игра, в которой компьютер претендует на роль человека с другим человеком. Если машине удается убедить человека в диалоге с человеком во плоти, он прошел тест. Всего через два года Артур Самуэль разработал компьютер, который знал как играть в шашки, и его навыки улучшались в каждой игре: у программы была возможность учиться.

 

Наконец, в 1957 году Фрэнк Розенблатт разработал Perzeptron, первый алгоритм, который можно было бы изучить, по существу, искусственную нейронную сеть . С этого момента исследователи стали давать своим компьютерам все более сложные логические упражнения для решения. Машины решали их иногда лучше, иногда хуже.

 

В то же время крупные компании стали основными участниками развития машинного обучения: с Уотсоном , например, IBM разработала компьютер с огромным архивом информации и может отвечать на вопросы, заданные на естественном языке. Чтобы показать миру демонстрацию его навыков, в 2011 году компьютер был приглашен принять участие в знаменитом телешоу «Jeopardy», из которого он вышел победителем. Это событие очень напоминает шахматный матч 1997 года между чемпионом мира Гарри Каспаровым и другим компьютером IBM Deep Blue. В этом случае компьютер победил своего противника.

 

Google и Facebook используют машинное обучение, чтобы лучше понимать своих пользователей и предлагать им больше возможностей. DeepFace , компьютер Facebook, теперь способен идентифицировать лица на изображении с точностью 97%. Благодаря проекту Google Brain Project , гигант поисковой системы значительно улучшил распознавание речи в операционной системе Android, поиск фотографий в Google+ и видео рекомендации на YouTube.

Системы искусственного интеллекта

Что такое машинное обучение?

По сути, компьютеры и программы работают так, как это было ранее установлено для них: «В случае A, сделать B». Наши ожидания от современных компьютерных систем всегда выше; тем не менее программисты не могут предвидеть все мыслимые случаи и, следовательно, научить компьютеры всем возможным решениям. По этой причине важно, чтобы программное обеспечение могло принимать решения самостоятельно и соответствующим образом реагировать на неизвестные ситуации.

Для этой цели, должны быть созданы алгоритмы, которые позволяют программе учиться. Это означает, что первым шагом является заполнение данных, которые понимает компьютер и создает модель, чтобы иметь возможность создавать ассоциации.

Когда дело доходит до самообучающихся систем, также полагают, термины, связанные с ними: важно знать их, чтобы иметь лучшее представление о мире машинного обучения.

Искусственный интеллект

Исследование систем искусственного интеллекта (IA) пытается создать машины, способные действовать как человек: компьютеры и роботы должны анализировать свою среду, а затем принимать наилучшее решение. Поэтому они должны вести себя разумно в соответствии с критериями человека. И здесь кроется проблема определения таких критериев, потому что не ясно, какие параметры мы должны оценивать нашим собственным интеллектом.

В настоящее время искусственный интеллект или то, что считается таковым, не может имитировать человека (включая эмоциональный интеллект). Скорее всего, они изолирует себя от частичных аспектов, чтобы иметь возможность решать определенные задачи. Это обычно называют слабым искусственным интеллектом.

Нейронные сети

В нейроинформатике, машины работающие с дизайном, основанны на модели человеческого мозга. Эта отрасль исследований в области искусственного интеллекта рассматривает нервные системы как абстрактную точку зрения, то есть свободную от их биологических свойств и ограничивающуюся их режимом функционирования. Искусственные нейронные сети - это в основном абстрактные математические процессы, а не реальные проявления. Таким образом, создается сеть нейронов, состоящая из математических функций или алгоритмов которая, подобно человеческому мозгу, способна справляться со сложными задачами. Связи между нейронами по-разному мощны и способны адаптироваться к проблемам.

Большие данные

Выражение « большие данные » просто означает огромное количество данных. Тем не менее, нет определенной точки, в которой заканчивается разговор о данных.

Тот факт, что это явление в последние годы имеет большое освещение в средствах массовой информации, объясняется происхождением данных такого типа: во многих случаях поток информации состоит из пользовательских данных (интересов, профилей путешествий, жизненно важных данных), обнаруженных такими компаниями, как Google, Amazon и Facebook, чтобы более точно адаптироваться к своим пользователям. Такие количества данных уже не могут быть удовлетворительно оценены традиционными компьютерными системами: в конце концов, такое программное обеспечение может найти только то, что ищет пользователь. По этой причине необходимы системы самообучения, которые могут обнаружить неизвестные соединения.

Сбор данных

С помощью интеллектуального анализа данных определяется анализ больших данных. Обнаружение простых данных само по себе имеет относительную ценность. Однако накопление информации становится интересным, когда соответствующие характеристики извлекаются и оцениваются , подобно тому, как извлекается золото. Развертывание данных отличается от автоматического обучения, поскольку оно основано на применении признанных моделей, а не на поиске новых.

Различные методы машинного обучения

По сути, исследователи проводят различие между контролируемым обучением и неконтролируемым обучением посредством промежуточных уровней, постепенно. Алгоритмы, используемые для этой цели, сильно отличаются друг от друга. При контролируемом обучении система снабжается примерами. Разработчики указывают, какое значение связывает соответствующую информацию, например, если она относится к категории A, а не к B. Из этого система самообучения выводит определенную информацию и рисует модель, которую сможет распознавать в будущем, а также смогут лучше обрабатывать неизвестные данные. Основная цель - свести к минимуму количество ошибок.

 

Известным примером контролируемого обучения являются фильтры спама : на основе определенных характеристик система решает, должна ли электронная почта попадать в папку «Входящие» или в спам-бокс. Если система выходит из строя, вы можете вручную установить параметры, на которые будет ссылаться фильтр в будущем. Таким образом, программное обеспечение будет получать лучшие результаты. Эта программа фильтрации основана на теореме Байеса, для которой она называется «байесовским фильтром».

 

Что касается неконтролируемого обучения, то в этом случае учитель, у которого в процессе обучения есть задача проинструктировать систему и дать связь с решениями, принятыми машиной, отсутсвует. Вместо этого программа пытается самостоятельно распознать повторяющиеся шаблоны. Для этого, например, возможность использования кластеризации: из массы всех данных, выбераются элементы, характеристики которые анализируются и сравниваются с уже рассмотренными. Если программа уже проанализировала аналогичные элементы, то к ним добавится текущий объект; иначе он будет изолирован.

 

Системы, основанные на автоматическом обучении, также реализуются в нейронных сетях. Есть примеры приложений в сетевой безопасности : которая может распознать ненормальное поведение. Хотя, невозможно связать кибератаку с известной группой, программа все же может распознать наличие угрозы и затем приступить к запуску тревоги.

 

В дополнение к этим двум основным направлениям есть также частично контролируемое обучение ( полуконтролируемое обучение ), обучение подкреплению и активное обучение : эти три разных метода больше относятся к контролируемому обучению и они отличаются своей природой и способами вовлечения пользователей.

 

Следует также провести различие между так называемым мелким обучением и глубоким обучением . В то время как первый является относительно простым методом, для которого результаты являются довольно поверхностными, что касается последнего, то речь идет о количествах, которые сложнее понять. Сложность этих данных связана с тем, что они являются естественной информацией , то есть, которые появляются в распознавании речи, письменном языке или лице. Для людей естественные данные просты в обработке, в то время как для машины это сложно усвоить математически.

 

Глубокое обучение и искусственные нейронные сети тесно связаны друг с другом. Способ обучения нейронных сетей можно определить как глубокое обучение: глубокое, потому что сеть нейронов организована на разных иерархических уровнях . Первый уровень состоит из входящих нейронов, которые обнаруживают данные, начинают с их анализа и отправляют результаты на следующий нейронный узел. В конце информация, время от времени становиться более точной, достигая уровня выхода, и сеть выдает значение. Уровни, в целом очень многочисленные, они расположены между входом и выходом и называются скрытыми уровнями ( скрытые слои ).

 

Чтобы лучше объяснить глубокое обучение, вы можете использовать Google image research в качестве примера . Сеть, лежащая за алгоритмом поиска, обеспечивает запрос «кошек» только изображениями, которые фактически представляют домашних кошек. Этот механизм работает, потому что система самообучения Google способна распознавать объекты внутри изображения. Когда Google записывает новое изображение в свой каталог, входные нейроны системы обрабатывают данные; в конце концов, согласно компьютерам, изображения состоят только из чисел.

 

Во время путешествия по различным уровням сеть фильтрует только необходимую информацию, пока окончательно не решит, какие объекты находятся на изображении (например, кот). На этапе обучения разработчики также предоставляют категорию для каждого изображения, чтобы система могла учиться. Если машина давала бы ложные результаты, то изображения с собаками являлись бы правильными для поиска «кошек». Как и человеческий мозг, последние имеют разные весовые коэффициенты и пороги, которые могут быть разработаны в системе самообучения.

 

Как работает автоматическое обучение?

В настоящее время машинное обучение очень полезно для маркетинга; на данный момент крупные компании используют эту технологию, в первую очередь Google. Системы самообучения все еще настолько новы, что вы не можете купить их как продукты из коробки. На их месте крупные интернет-компании развивают свои системы и поэтому играют новаторскую роль в этой области. Поскольку некоторые компании, несмотря на коммерческие интересы, по-прежнему придерживаются подхода с открытым исходным кодом и сотрудничают с независимыми исследованиями, прогресс в области машинного обучения становится все более быстрым.

 

Наряду с творческим моментом, маркетинг также имеет аналитический аспект : статистика поведения пользователей (поведение покупателей, количество посетителей сайта, использование приложений и т. д.) Она играет важную роль в решении определенных рекламных мер, обычно правило состоит в том, что чем больше объем данных, тем больше информации можно экстраполировать. Чтобы была возможность разрабатывать такую ​​массу функций, нужны умные программы. В этот момент внедряются системы самообучения: образовательные программы распознают повторяющиеся шаблоны и могут делать надежные прогнозы, в отличие от людей, которые часто  не используют этих данных.


Обычно те, кто анализирует данные, начинают с ожиданий, которые в конечном итоге становятся реальными предрассудками , практически неизбежными для людей, и которые часто являются причиной искажения результатов. Чем больше анализируемых аналитиками данных, тем больше ошибок в интерпретации данных. Одни и те же интеллектуальные машины, когда дело доходит до конкретных фактов, действуют с большей объективностью, чем эксперты во плоти. Поэтому можно сказать, что машины обеспечивают более надежный анализ.

 

Системы самообучения улучшают и упрощают представление результатов анализа, как это происходит при автоматизированной визуализации данных , технологию, в которой компьютер самостоятельно выбирает правильное представление данных и информации. Это особенно важно, потому что это позволяет людям понять, что машина открыла и что ожидала. При огромных потоках данных становится сложно представлять результаты оценок самостоятельно. По этой причине визуализация также должна выполняться с использованием компьютерных вычислений.

 

Тем не менее, машинное обучение также может влиять на создание содержимого: как это происходит, например, в генеративном дизайне . Вместо того, чтобы разрабатывать один и тот же путь для всех пользователей, состоящий из шагов, которые клиент делает для покупки продукта или услуги, динамические системы могут создавать персонализированные впечатления благодаря автоматическому обучению. Хотя контент, отображаемый пользователем на веб-сайте, по-прежнему предоставляется копирайтерами и дизайнерами, система должна интегрировать конкретные компоненты для пользователя.

 

В то же время в дизайне также используются системы самообучения: например, с помощью проекта Dreamcatcher, инновационной системы САПР, созданной исследовательской группой компании Autodesk, можно разработать компоненты для машины.

 

Машинное обучение также может использоваться для лучшей организации чатов . Многие компании уже используют программы, которые поддерживают клиентов с помощью чатбота. Однако во многих случаях пользователи быстро справляются с роботами: возможности текущих чатботов обычно очень ограничены, а возможные ответы относятся к базе данных, управляемой вручную. Чатбот, основанный на самообучающейся системе и обладающий хорошим распознаванием голоса, способен передать клиентам ощущение действительно общения с человеком и, следовательно, также пройти тест Тьюринга.

 

Amazon и Netflix демонстрируют еще одно преимущество машинного обучения для маркетологов: рекомендации . Среди важных факторов успеха этих крупных компаний также есть способность прогнозировать то, что пользователь хочет иметь. Системы самообучения могут сообщать пользователю о других продуктах независимо от собранных данных. То, что ранее было возможно только в больших масштабах («Наши клиенты, такие как продукт A, поэтому большинство из них будет интересоваться продуктом B.»), теперь это также возможно в меньших масштабах благодаря современным программам ( «Клиент X любил продукты A, B и C, поэтому он, вероятно, будет интересоваться продуктом D.»).

 

Таким образом, можно видеть, что системы самообучения будут влиять на четыре различных аспекта онлайн-маркетинга:

  1. Количества. Программы, которые работают с машинным обучением и хорошо образованы, могут обрабатывать огромные объемы данных и делать прогнозы на будущее. Эксперты по маркетингу могут сделать более точные выводы об успехах или неудачах кампаний и рекламных мер.

  2. Анализ скорости требует времени, если выполняется вручную. Благодаря системам самообучения скорость работы увеличивается, и поэтому вы можете легче реагировать на изменения.

  3. Автоматизация. Благодаря автоматическому обучению легче автоматизировать процессы. Поскольку современные системы имеют возможность самостоятельно адаптироваться к новым условиям с помощью машинного обучения, возможны даже сложные процессы автоматизации.

  4. Настройка. Программное обеспечение может помочь бесчисленным клиентам. Поскольку системы самообучения обнаруживают и обрабатывают данные от отдельного пользователя, они могут заботиться об этих клиентах комплексно. Индивидуальные консультации и поездки клиентов, специально разработанные, помогают более эффективно применять маркетинговые меры.

Другие области применения систем самообучения

Маркетинг - это не единственный способ найти различные способы использования машинного обучения: эти системы также эффективны во многих других областях человеческой жизни. Частично это способствует дальнейшему развитию науки и техники. В некоторых случаях они просто используются в форме больших или меньших гаджетов для упрощения повседневной жизни. Представленные области приложений являются лишь некоторыми из возможных примеров, ведь нельзя исключать, что в недалеком будущем машинное обучение будет присутствовать во всех аспектах нашей жизни.

наука

То, что справедливо для маркетинга, имеет еще более важное значение в науке. Интеллектуальная обработка больших данных значительно упрощает работу эмпирических исследований. Например, благодаря системам самообучения физики частиц могут обнаруживать и обрабатывать многие другие данные и видеть любые аномалии. Но машинное обучение также может помочь медицине : даже сейчас некоторые врачи используют искусственный интеллект для диагностики и лечения. Кроме того, машинное обучение также полезно для прогноза диабета или сердечных приступов.

 

робототехника

В настоящее время роботы вездесущи, особенно на фабриках: они используются, например, в массовом производстве, чтобы автоматизировать равные рабочие процессы. Тем не менее, это не действительно интеллектуальные системы, поскольку они запрограммированы только для выполнения одного конкретного шага. Когда самообучающиеся системы используются в робототехнике, они должны иметь возможность решать новые задачи. Естественно, эти достижения также представляют большой интерес для других секторов: от космических путешествий до домашних работ, роботы с искусственным интеллектом могут принимать меры во многих областях.

трафик

В автономных автомобилях большие перспективы для обучения. Только машинное обучение означает, что автомобили движутся автономно и безопасно, а не только на тестовых дорогах. Поскольку невозможно запрограммировать все возможные ситуации, важно, чтобы автономные транспортные средства относились к интеллектуальным машинам. Но самообучающиеся системы не ограничиваются революцией транспортных средств в движении: интеллектуальные алгоритмы, например, в виде искусственных нейронных сетей, которые могут анализировать трафик и разрабатывать более эффективные способы управления, например, путем интеллектуального включения светофоров.

интернет

Уже сейчас машинное обучение играет важную роль в Интернете. Мы говорили о спам-фильтрах : через постоянные фильтры обучения уточняются данные, и они могут лучше распознавать нежелательные электронные письма, чтобы более надежно их запрещать. То же самое относится к контрасту вирусов и вредоносных программ : благодаря новым интеллектуальным технологиям компьютеры более защищены от вредоносного программного обеспечения. Также алгоритмы ранжирования поисковых систем, в первую очередь Google RankBrain, являются системами самообучения. Даже если алгоритм не понимает вставки пользователя (поскольку до этого момента его никто не искал), он может вывести и сделать предложение, которое может быть присуще запросу.

Личные помощники

Даже в домашних условиях присутствие интеллектуальных компьютеров становиться все больше и больше: здесь обычные дома становятся умными домами. Например, компания Moley Robotics разрабатывает интеллектуальную кухню с механическими рукавами, которые готовят блюда. Личные помощники, такие как Google Home и Amazon Echo, благодаря могут контролировать системы и устройства в вашем доме, используют технологии машинного обучения, чтобы лучше понимать потребности своих пользователей. И многие люди не отказываются от своего помощника, даже когда они рядом: Siri, Cortana и Google Assistant позволяют пользователям давать команды и задавать вопросы своим смартфонам.

Игры

С самого начала исследований по искусственному интеллекту способность машин играть всегда была большим стимулом для исследователей. Системы самообучения были испытаны в шахматах, шашках, а также в популярной китайской настольной игре.Разработчики игр имеют возможность использовать машинное обучение для создания более сбалансированного игрового опыта для того, чтобы виртуальные противники лучше адаптировались к поведению игроков-людей.