Кого заменит робот в ближайшие три года

Кого заменит робот в ближайшие три года

Нет никого более властного, чем консьержи, уборщицы и другие мужчины и женщины, следящие за порядком во вселенной. Только что работница кинотеатра прогнала от двери известного бизнесмена, который заблудился. С характерным советским: «Молодооой человеееек!» Вроде ничего такого и не сказала, но в интонации отчетливо читается продолжение обращения — «куда прете?». Никаких новомодных: «Может, вам чем-то помочь?»

Комично, что именно этот «молодой человек» успешно работает над тем, чтобы заменить персонал в сфере услуг роботами.

Алексей Южаков основатель международных проектов в сфере автоматизации процессов. Наиболее известные его проекты — компания «Юникорн» с платформой интернета вещей MySmartFlat и Promobot в области сервисного роботостроения. В прошлом году выручка Promobot выросла на 82% до 67,6 млн руб., по данным «Контур.Фокус». В 2018 году ожидается, что она вырастет в три раза, благодаря росту экспорта.

Алексей Южаков, сооснователь компании Promobot:

— Пока мы видим, что в мире роботов в 90% случаев покупают для вау-эффекта, а не для объективной пользы. Это актуально и для b2с, и для b2b сегментов. В b2с — тот же робот-пылесос. Всем его показали, собака покаталась на нем, и он потом пылится. В b2b — показали робота акционерам, государству, и все. Вау-эффект — это как нефть для России. Когда он есть — это хорошо, но когда ты на него подсел — это плохо, и ты никуда уже не двигаешься.

Мы, Promobot, прокладываем новый путь — нашего робота применяют в узких бизнес-направлениях. Он может, как Гена Букин, обувь продавать, может в банке работать, гидом, экскурсоводом и так далее. Такой робот автоматизирует часть бизнес-процесса. Например, встречает людей. По лицу узнал, привел, проводил. Не самые культурные охранники разговаривают с людьми сквозь зубы. Робот мог бы по-другому встретить? Мог. Но при этом он не может одновременно принести кофе и вытереть лужу, если пролил его, не может дать по голове, если ты продираешься сквозь охрану.

 

Роботы станут повсеместными — заменят консьержей, охранников, консультантов, но это не приведет к массовой безработице. Появятся новые специальности — необходимые для обслуживания роботов, например. Появятся новые направления, которых еще нет. Когда-то были повозки на лошадиной силе, никто и не предполагал, что будут люди, которые свяжут жизнь с шиномонтажом.

Сегодня что происходит. Наши партнеры зарабатывают на роботах — сдают их в аренду, пишут для них спецсофт. Мы будем испытывать софт, который создали ребята из пермского политеха. Они обучили робота международным танцам. Это новое направление. Нужны ли для него какие-то специфические навыки? Конечно.

Но пока роботы несовершенны в свободной коммуникации с людьми. Главная проблема — они не слышат! Эксперты пишут, что роботы распознают 95% речи. Это неправда. Такой уровень возможен разве что в изолированном помещении при 33 микрофонах, когда не перебивают. Мы же с вами работаем в других условиях.

Мы ведем разработки в этом направлении — уже создали свой микрофон, ПО для шумных помещений. Все наши 400 роботов рассчитаны на реальные шумовые условия. Неидеально пока справляются. Но мы, пожалуй, чуть лучше это делаем, чем наши конкуренты.

Вторая проблема — направленность диалога. Стоял бы сейчас перед вами робот. О чем бы вы его спросили? Обычно задают вопросы о погоде, расстоянии до Солнца, весе и стоимости робота. Он может ответить на 70–80% таких вопросов, подготовить его — не проблема. Но ценность таких ответов только в хайпе. А что для бизнеса? Да плевать бизнес хотел на то, какая погода. Ему важно, купят у него или нет. И вот тут направленные диалоги — это то, что робот должен уметь, чтобы продавать. «Погода за окном -4 градуса, но в «таком-то банке» всегда хорошая погода. Ты пришел в «банк». Какую услугу я могу предложить?»

 

Параллельно развивается отрасль секс-роботов. Это хорошее направление, очень интересное. И как бы мы не относились, уверен, что года через три мы с вами рядом сядем и увидим, не только у кого какой смартфон, но и будем знать, что у вас Том-325, а у меня, допустим, Джессика-17. И это будет абсолютно нормально.

Хороший вопрос о том, как изменится коммуникация между людьми, когда мы станем уделять еще больше времени общению с роботами. Ответ такой — точно повлияет. Я не могу судить как именно, так как не эксперт в социологии. Наверно, появятся те, кто будет изучать отношения людей и роботов.

Пару веков назад обоняние человека было лучше, чем сейчас. Мы перестали этим пользоваться — с развитием технологий что-то отмирает. Доказан факт, что мы хуже концентрируемся, внимание все время отключается и переключается, зато мы стали полизадачными. Так же будет с роботами. Они точно что-то принесут, но что-то мы потеряем. Нужно понимать, что это неизбежно и что будут и минусы, и плюсы.

Ок. Мы потеряли острое обоняние, зато мы приобрели какую-то когнитивную функцию, которая позволила нам разработать то, что мы разработали. Если мы потеряем возможность долго концентрироваться и воспринимать длинные тексты, потому что есть Google и Яндекс, то, значит, мы направим операционные возможности мозга на что-то другое.

В «Яндексе» уверены, что искусственный интеллект сделает жизнь человека лучше. Ему не придется заниматься рутинной работой, а прибыль коммерческих предприятий за счет оптимизации процессов возрастет. Их не пугают сюжеты фантастических голливудских фильмов и повсеместная слежка. Почему — в интервью 66.RU рассказывает глава службы компьютерного зрения компании Александр Крайнов.
За полвека искусственный интеллект научился разговаривать с человеком, различать человека и обыгрывать человека в игру го. Как ни странно, именно последнее достижение машины наиболее ценно для развития и популяризации науки.

Компьютерные симуляторы давно лучше человека играют в интеллектуальные настольные игры — нарды или шахматы. Если в 1989 году Гарри Каспаров в партии из двух блицев легко обыграл шахматную программу Deep Thought, то через семь лет российский гроссмейстер уступил ее усовершенствованной версии. Го долгое время оставалась последним непокоренным бастионом, но недавно пал и он: матч AlphaGo с самым титулованным профессиональным игроком Ли Седолем завершился со счетом 4:1.

В основе этой разработки стоят нейросети — самая быстропрогрессирующая область создания искусственного интеллекта. Технология имитирует поведение нейронных сетей в головном мозге человека. Если упростить, то обучение нейросетей похоже на обучение двухлетнего ребенка: взрослые показывают малышу много картинок, называя те предметы, которые изображены на них. Через некоторое время он выделяет закономерности и сам способен отличить, например, яблоко от груши.

Бум произошел за счет огромных вычислительных мощностей компьютеров и большого количества размеченных данных в интернете. Этого достаточно, чтобы искусственный интеллект постепенно «умнел». Кажется, что искусственный разум когда-нибудь разовьется до такой степени, что сможет обходиться без человека и начнет ядерную войну. На фобии параноиков разработчики ИИ отвечают, что свободная воля суперкомпьютера вписывается в жесткие рамки алгоритмов и математических моделей, а алгебраическое понятие «формула» никогда не будет соседствовать с определением «целеполагание» из психологии. Как в любом учебнике.

В авангарде разработок нейросеть-сервисов в России стоит «Яндекс». Мы встретились с руководителем службы компьютерного зрения компании Александром Крайновым, часто выступающим на российских и мировых научпоп-конференциях, и поговорили с ним о философии, футурологии и немного о математике.

— В бытность моего студенчества большой популярностью пользовалась платформа Last.fm. Если кто не помнит, это сайт, куда загружается любимая музыка, а сервис предлагает похожие треки. Плюс на сайтах интернет-магазинов часто встречается рубрика «Вместе с этим товаром пользователи берут…». Мы уже тогда пользовались нейросетями?

— Нейронные сети тогда, конечно, уже существовали. Они появились в шестидесятые годы. Тут надо сказать, что это один из видов машинного обучения, способ составить формулу и провести по ней какие-то вычисления. Для одних задач нейросети хороши, для других — не очень.

Именно для рекомендательных сервисов нейросети работают не лучшим образом, поскольку там мало факторов принятия решения и они очень неоднородны: возраст, пол, жанр, страна и так далее.

Нейронная сеть максимально эффективна тогда, когда у нас много факторов и они максимально однородны: пиксели изображения, акустический сигнал и т.д.

— Наверное, я, гуманитарий, пожалею о своем вопросе, но как это все работает?

— Любая нейросеть состоит из нескольких слоев, а слой — из множества нейронов. Есть входной слой, есть множество промежуточных — выходной. Каждый нейрон — это математическая формула, которая совершает преобразование над полученной информацией. Цель этих изменений — обобщить то, что нужно обобщить, и разделить то, что нужно разделить, для корректной работы. Нейроны каждого последующего слоя связаны с нейронами предыдущего.

Возьмем распознавание речи. Оцифрованный акустический сигнал многократно модифицируется, проходя через слои. Цель этих модификаций — обобщить то, что нужно обобщить, и разделить то, что нужно разделить, для надежного распознавания фонем.

То есть все типовые произношения одной фонемы (звуковое представление буквы) должны быть преобразованы в максимально близкие значения.

При этом машина сама подбирает формулу преобразования аудиосигнала путем внутреннего перебора. Таким образом, нейросеть получает одну матрицу на входе и выдает другую на выходе.

После этого используется языковая модель: вероятность последовательностей фонем для, например, русского языка. Человек ведь тоже исходя из контекста понимает, что сказано, даже если он не расслышал часть слова.

— Чему за 50 лет научились нейросети?

— Лучше всего они справляются с задачами распознавания изображений (статических или динамических) и речи. Последняя большая история, связанная с нейросетями, — это анализ и генерация текста, перевод и голосовые помощники.

— Правильно ли я понимаю, что сейчас для разработчиков главный вызов — это сделать адекватный перевод текста с возможностью конвертации звука в текст или наоборот?

— Да. Но он уже решен. Можно понимать друг друга без проблем. Хотя есть к чему стремиться. Например, к уровню профессионального переводчика.

— А когда робот вытеснит из этой профессии человека?

— Сложно сказать. Скоро точно исчезнут плохие переводчики-ремесленники. Думаю, останется литературный перевод, когда надо сохранить конкретные фразы или идиомы. В некоторых случаях надо переводить не дословно, а с подбором синонимических образов. А в документах или научных статьях важно оставить термины, как есть (если нет строгого аналога).

— В каких сферах еще будет использоваться искусственный интеллект?

— В банках давно используется. Появится в медицине, хоть это и очень зарегулированная сфера, судопроизводстве. Хорошее судебное решение — максимально беспристрастное. А использование машин исключает, во-первых, эмоции, во-вторых, коррупционную составляющую.

Что еще? Самодвижущиеся машины, диалоговые системы. Думаю, недолго осталось композиторам, которые пишут примитивные попсовые песенки или фоновую музыку, и поэтам-графоманам.

— Журналисты?

— Смотря какие. Нейросети никогда не справятся с тем, чтобы найти тему, создать новостной сюжет, повернуть тему, эмоционально подсветить. С другой стороны, есть задача собрать дайджест, обработать пресс-релиз. Такие функции, конечно, в будущем отдадут роботам. Мало того, они и сейчас уже местами используется для этих задач.

Вообще искусственные нейронные сети эффективнее человека: а) в выполнении однообразных узких задач; б) в выполнении задач, для которых у нас достаточно размеченных данных.

Врач по рентгеновскому снимку определяет, сломана кость или нет. Это не только профессиональный навык, но и профессиональный опыт. Если накопилась база из десятков тысяч снимков, где есть перелом, то машина будет выполнять эту узкоспециализированную задачу эффективнее человека. Она ведь может накопить «опыт» не меньший, чем у человека, а опыт человека в других областях тут никак не помогает.

— У многих людей (даже не самых глупых) есть страхи, связанные с ИИ. Главный визионер планеты Земля Илон Маск считает, что цивилизация в опасности и нужно ограничить сферы применения ИИ.

— В этом отношении я согласен с Марком Цукербергом чуть больше, чем полностью (создатель Facebook считает, что ИИ сделает жизнь лучше, — прим. 66.RU). Человек, который хорошо представляет себе, что происходит внутри нейронной сети, вряд ли будет высказывать такие опасения. Нейронная сеть — это формула, которая принимает четкие понятные данные на входе и предлагает решение на выходе. Как и любая другая формула, она не может решать иные задачи. Формула решения квадратного уравнения не может покупать продукты в магазине или захватывать Вселенную. Не надо подозревать теорему Пифагора в замысливании злодейства. Это даже звучит абсурдно.
Человек четко сформулировал нейросети задачу и дал четкие критерии измерения. Не может быть цели всех победить, может быть цель оптимизировать отдельный параметр.

— Например?

— Например, беспилотный автомобиль. Не может быть формулировки «доехать до места назначения самым лучшим образом». Значит, нам надо ее переформулировать. О! Доехать максимально быстро. Но тогда — это езда по тротуарам, нарушения ПДД и скоростного режима. Мы вводим новые данные, что нельзя нарушать скоростной режим, а езда должна быть плавной. Окей, вносим еще одну поправку: движение без резких разгонов и торможений. Дальше мы создаем пенальтизацию (штраф) за каждый дорожный инцидент, и чем меньше будет штрафных баллов, тем лучше нейросети справились с задачей. И в результате мы получаем четкую метрику, по которой мы сможем оценивать результат работы.

— То есть ошибки все-таки могут возникать?

— В любом машинном обучении, в том числе в нейросетях, есть такое понятие, как hard negative — примеры, на которых алгоритм дает явно неверный результат. То есть произошла комбинация данных, которая не возникала при обучении. Это чем-то похоже на оптические иллюзии у человека. Есть понятные методики, как это исключить. Например, сделать комбинацию из двух систем, которые учились на разных данных. Работает одна формула, которая лучше принимает решение, а вторая страхует, если ей кажется, что результат подозрительно не тот.

— Если речь идет о дорожной обстановке, то цена ошибки резко возрастает.

— Наша первая мысль, когда беспилотный автомобиль собьет на дороге человека, — надо запретить. Но если мы проанализируем сухую статистику и выясним, что автомобиль под управлением робота попадает в аварии, допустим, в 10 раз реже человека, мы ведь не запретим водить человеку.

С водителем проще, поскольку мы у него можем отобрать права и посадить в тюрьму. А у алгоритма нет понятия экземпляра за рулем, формула везде одна и та же. Что делать? Нужно обозначить приемлемый безаварийный наезд. Если он соблюдается — внедряем уравнение, нет — забываем.

Да, это звучит невероятно цинично. В нашем гуманистическом обществе такие оценки не приняты. Значит, должно что-то поменяться в сознании. Должно пройти время, чтобы мы поняли, что на беспилотных автомобилях ездить безопаснее.

— Понятно, что у компьютера нет морали. Тогда чем будет руководствоваться беспилотный автомобиль в критической ситуации, когда ему необходимо сделать выбор, кого сбить — женщину или ребенка?

— В каждый конкретный момент времени алгоритм решает не кого сбить, а в какую сторону повернуть и какую педаль нажать. Это решение зависит от того, в каком случае функция ошибки меньше. Если программист назначил одинаковую оценку ошибки, то беспилотник сделает выбор, исходя из меньшей вероятности кого-то сбить. Если авторы алгоритма, оптимизируя функцию, не внесли в нее жизнь водителя, то алгоритм пожертвует его жизнью. Просто это не приведет к увеличению ошибки.

Так что этический выбор стоит не перед формулой, а перед разработчиком. А шире — перед обществом. А общество ссылается на закон. Что такое закон? Это закрепленное в обществе представление о том, что такое плохо, а что хорошо. А к беспилотникам отношения у нас еще толком не выработалось. Поэтому если сравнивать технологическую, эмоциональную и правовую готовности, то первая далеко впереди.

— Да, и речь сейчас не только про транспортные средства. Человеку неприятно, когда робот собирает про него сведения: перемещения, слежки… Внутренне некомфортно.

— Когда только появились пластиковые карты, многие опасались, что все их траты будут напоказ. Кто-то до сих пор принципиально пользуется только наличными, это их дело. Для большинства ситуация упростилась. Тенденция — жизнь напоказ в соцсетях. А скажем, камеры помогают превентивно бороться с преступниками. Никто не следит за каким-то конкретным человеком, нужно очень сильно проявить себя в жизни.

— Несколько лет как популярны голосовые ассистенты. Голосовые помощники научились хоть как-то поддерживать разговор и обращаться к сторонним сервисам. А какие еще функции в процессе развития технологий смогут выполнять виртуальные помощники?

— В любых голосовых помощниках есть два важных момента: general conversation (свободное общение на отвлеченную тему) и решение конкретных сценариев. Первая часть очень тяжелая, и она будет развиваться медленнее, пока это, действительно, только развлечение. Что касается решения сценариев, то дело не в технологиях, а в трудозатратах и целесообразности. Создание одного сценария от другого отличается слабо.

Предположим, у нас есть сценарий заказа такси. Чтобы его реализовать, нужно научиться узнавать все фразы, которые этот сценарий вызывают. Чтобы понять, откуда нам надо доехать, нужно заполнить соответствующие поля. Мы создаем шаблоны — типовые словосочетания, из которых мы можем извлечь нужные данные.

В общем, почти так же, как в мобильных приложениях сейчас, только команды отдаются голосом. Или, например, заказ еды в ресторане — то же самое. Принцип — один и тот же. Если вы спросите у строителя, как он строит дом, он вам расскажет. А как улицу? Да так же! Только дома расположим в ряд и озадачимся общей инфраструктурой.

— Я не представляю, как вы зарабатываете на general conversation. Наверное, это такая имиджевая штука. А какие еще есть возможности конвертировать нейросети в деньги?

— Зарабатывать нужно не на нейросетях. Нейросети — это ведь лишь инструмент, который решает какую-то пользовательскую задачу. Мне кажется, что такой подход, как «у меня есть молоток, и как бы мне заработать?», не очень действенен. Эффективнее посмотреть, какие есть потребности, и исходя из этого решать, использовать молоток, пилу или грабли. То есть зарабатывать нужно не нейросетях, а на продуктах.

Нейросети могут быть полезны и традиционно консервативным областям — крупным транспортным или металлургическим предприятиям, у которых огромные доходы и огромные расходы, и весь бизнес строится на небольшой дельте. В этом случае оптимизация даже одного процента серьезно увеличивает чистую прибыль.

— Компьютер выиграл в го лучшего игрока. И это событие наглядно продемонстрировало миру, что нейросети — мощная штука. Почему это произошло?

— От множества других игр го отличается тем, что при простых правилах игра невероятно сложная. Вариантов развития там больше, чем атомов во Вселенной. И в обозримом будущем никакие вычислительные мощности не смогут просчитать все ходы. Именно поэтому в игре сочетается расчет и интуиция. Расчет позволяет просчитать несколько вариантов на несколько ходов вперед, а интуиция позволяет выбрать лучшие варианты для расчета. Выбирая ход, человек руководствуется чувством гармонии. Я склонен думать, что наша интуиция — это основанная на нашем опыте способность делать предсказание вероятности того или иного исхода.

— Интуиция — это ведь архетипичное человеческое свойство. Как нейронная сеть училась играть?

— Сделали две нейросети. Первая предсказывала следующий ход в партии. Загрузили множество сыгранных в интернете партий, и система научилась находить некие шаблоны, т. е. ходы, которые наиболее типичны в подобных ситуациях (при том, что каждый раз ситуация заметно отличается от ранее сыгранных — партии в го не повторяются).

В качестве положительного примера брались позиции сильных игроков, отрицательного — случайные позиции или позиции проигравших. В результате нейросети не научились делать однозначно лучший ход, но создали набор наиболее реалистичных гипотез, которые можно проверять.

Вторая сеть училась оценивать позицию на доске, понять, у кого сейчас преимущество. При обучении ей на вход давали сведения о ситуации на доске, знания о том, чей сейчас ход, и исход партии. Тогда машина научилась предполагать, кто выиграет. Конечно, эти данные очень «шумные»: у игрока может быть выигрышная позиция, но он проиграл из-за провального хода. Но если взять десятки тысяч партий, то можно найти закономерности. Т. е. все как у человека: вначале появляется мысль, куда сходить, потом происходит оценка полученной в результате предполагаемого хода позиции.

В машинном обучении всегда нужно много данных. В го было сыграно много партий, но ведь нужны не случайные, а сыгранные сильнейшими профессионалами. А их относительно мало. Разработчики сделали так, что программа стала играть сама с собой и накапливать объем.

В философском смысле го — модель нашей жизни. Все, что нас окружает, что с нами происходит, подчиняется физическим законам и, значит, просчитывается. Но поскольку вычислить все невероятно сложно, то мы заменяем расчет какими-то обобщениями, создаем паттерны и схемы. Для упрощения мы оперируем понятием, что Солнце всходит на Востоке, но ведь на самом деле Солнце ниоткуда не всходит, а Земля кружится вокруг него.

То же самое в го. Теоретически все позиции, ходы, интуицию можно заменить расчетом. Но на практике компьютер заменяет это абстрактными понятиями, поскольку даже у него не хватает вычислительных ресурсов на полный расчет всей партии.

*****
P.S. «Если компьютер сможет превзойти в шахматах лучшего из лучших, это будет означать, что ЭВМ в состоянии сочинять самую лучшую музыку, писать самые лучшие книги», — сказал Гарри Каспаров 1989 году после своей победы над шахматной программой.