Научная
деятельность
Университет ИТМО

Не селфи единым: как нейросети помогают ученым искать сверхбыстрые звезды и диагностировать болезни

Приложение Teleport на основе нейросетей, которое за секунду превращает селфи в коллаж с разноцветными волосами, всего за несколько дней заняло второе место в рейтинге бесплатных приложений AppStore. Сейчас его скачали более 1,5 млн раз, сервис стал вирусным, почти повторив успех похожих приложений по редактированию фото: Meitu, превращающее любого в героя аниме, FaceApp, позволяющее посмотреть на себя в старости и даже «поменять» пол, и приложение Prizma, которое любой, даже не самый удачный снимок способно превратить в шедевр в стиле Моне или Ван Гога. Сегодня нейросети помогают выбрать цвет волос и помады, «придумывают» названия сортов пива и рисуют котиков, но их идеальное применение, конечно же, не ограничивается зарабатыванием «лайков» в Instagram. Под силу им и куда более серьезные задачи в бизнесе, финансовом секторе и науке. Диагностика заболеваний, поиск сверхбыстрых звезд и редких животных — о том, как нейросети помогают ученым, в обзоре ITMO.NEWS.

Аналитическая компания Gartner называет технологии искусственного интеллекта главным полем битвы до 2020 года. Сегодня их активно берут на вооружение крупные компании и стратапы, а приложения на основе нейросетей регулярно добираются до первых строчек App Store. В конце июля очередного пользовательского успеха добилось приложение по редактированию снимков Teleport. Программа обрабатывает фотографии пользователя: меняет цвет волос и фон, «перемещая» человека в различные места. По данным сооснователя проекта Виктора Коха, в основе технологии лежит принцип нейросети, который помогает отделять от фона волосы и силуэт человека. Для обучения программы пришлось отделить фон от изображения на 30 000 графических файлах. Teleport уже получил инвестиции в $1 млн. На данный момент приложение скачали более 1,5 миллионов человек.

Ранее подобных успехов уже достигали ряд приложений по обработке снимков, основанных на нейросетях. Год назад, летом 2016 года, вирусной популярности на массовом рынке добилось приложение Prisma. По данным системы аналитики App Annie, за девять дней приложение стало одним из самых скачиваемых в десяти странах: России, Белоруссии, Эстонии, Молдавии, Киргизии, Узбекистане, Казахстане, Латвии, Армении, Украине. Принципиальная новизна Prisma заключалась в том, что обработка в ней осуществляется не с помощью наложения фильтров, изображение анализируется самообучающейся нейронной сетью, расположенной на сервере, после чего полностью перерисовывается.

В этом году говорить о себе заставило приложение FaceApp, также позволявшее редактировать селфи с помощью нейронных сетей. По данным сервиса AppAnnie, первое место в магазине приложений Apple оно занимало в 12 странах (в первую очередь в России и странах СНГ). В 29 государствах, в основном в Европе, — вошло в топ-10.

Приложение FaceApp
Приложение FaceApp

С чем связан бум нейросетей? До 2010 года не было понимания, что размер и глубина нейросетей имеют принципиальное значение для качества их работы. Проводить эксперименты с глубокими сетями было практически невозможно из-за малого размера оперативной памяти и слабой производительности компьютеров, отмечает Давид Ян, основатель компании ABBYY. Сегодня ситуация поменялась. И вслед за увеличением мощностей технологии хлынули в различные сферы деятельности, в том числе в массовый сектор, где за короткое время успели завоевать многомиллионную аудиторию. Впрочем, шум, который успели наделать искусственные нейросети, пошел на благо, полагает Александр Крайнов, руководитель службы компьютерного зрения и технологий машинного интеллекта «Яндекса». Ведь чем больше разговоров и интереса, тем больше в итоге инвестиций, исследований и стартапов.

С развитием технологий компьютерного зрения пользовательские приложения на основе нейросетей будут появляться все чаще, уверен и Николай Давыдов, управляющий партнер фонда Gagarin Capital (инвестор Prisma). При этом создание продуктов на основе нейросетей станет доступно гораздо большему числу разработчиков, считает он.

Сегодня продукты на основе нейросетей уже успели продемонстрировать успехи в банковском секторе, на финансовом рынке, в ритейле и даже в нефтегазовом секторе (например, стартап Nest Lab из Уфы с помощью машинного обучения позволяет повысить точность подбора мероприятий на нефтяных скважинах). Но помогают нейросети и ученым. О том, какие задачи уже оказались им под силу в биологии, медицине, экологии, робототехнике и астрономии, — в подборке ITMO.NEWS.

Развитие медицины и биокомпьютеры

В компании Microsoft считают, что рак похож на компьютерный вирус и его можно победить, взломав код. Сотрудники компании используют искусственный интеллект в медицинском проекте по уничтожению раковых клеток. В одном из направлений проекта используются машинное обучение и обработка естественного языка – они необходимы ученым для оценки всего объема ранее собранных данных при подборе плана лечения пациентов. Над похожим проектом работает компания IBM. С помощью программы Watson Oncology специалисты анализируют состояние пациента по собранным данным.

Еще в одном проекте Microsoft применяется система компьютерного зрения для радиологии, чтобы отслеживать процесс развития опухолей. Кроме того, в будущем корпорация планирует научиться программировать клетки иммунной системы как компьютерный код. По словам Джанет Уинг (Jeanette M. Wing), вице-президента Microsoft Research, компьютеры будущего могут не только состоять из кремния, но и из живой материи, что подталкивает компанию к поиску возможных способов биопрограммирования.

Диагностика проблем с сердцем

Нейросети уже помогают врачам диагностировать рак кожи, рак груди, заболевания глаз. Теперь настала очередь и кардиологии. В прошлом месяце ученые из Стэнфорда во главе с Эндрю Энджи (Andrew Ng), достаточно известным в своей сфере специалистом по искусственному интеллекту, разработали систему, которая способна диагностировать аритмию сердца по кардиограмме и делать это лучше, чем эксперт. В данном случае речь идет о нейросети, которая после обучения способна диагностировать аритмию с высокой степенью точности. После окончательной «доводки» системы задачу анализа медицинских снимков и результатов ЭКГ можно переложить на компьютер, считают авторы разработки. Врачу же останется лишь проверять работу программно-аппаратной платформы, о которой идет речь, и действовать в соответствии с окончательным диагнозом.


Чтобы система могла идентифицировать отклонения от нормы на данных ЭКГ, команде Стэнфорда пришлось потратить немало времени для обучения нейросети. Обучение происходило на примере реальных показателей пациентов больниц. Чтобы собрать несколько десятков тысяч результатов измерений ЭКГ, специалисты Стэнфорда обратились к партнеру — компании iRhythm, которая производит портативные ЭКГ-гаджеты. iRythm предоставила 30000 30-секундных записей результатов измерений работы сердечной мышцы пациентов, страдающих от разных форм аритмии.

Чтобы увеличить точность работы алгоритма, а также сравнить результаты работы компьютера с результатами диагностики врачей, использовались еще 300 записей. Их одновременно анализировали и машина, и врачи. Затем результаты оценивались специальным жюри, в которое вошли три кардиолога высшей квалификации. Глубокое обучение нейросети началось со «скармливания» огромного количества данных. Затем использовалась уже тонкая настройка для повышения точности диагностики.

Технологии машинного обучения для создания систем, способных диагностировать аритмию, используют и другие группы. В похожем направлении работает группа специалистов во главе с Эриком Горовицем (Eric Horowitz), управляющим директором Microsoft Research.

Помощь в поиске сверхбыстрых звезд и распознавания размытых снимков

Мощность телескопов ограничена размерами используемых в них линз или зеркал. Используя искусственные нейронные сети, группа исследователей из Швейцарии смогла перешагнуть этот предел, предлагая ученым получать самые четкие снимки, доступные при помощи оптической астрономии. В исследовании, опубликованном в журнале Monthly Notices of the Royal Astronomical Society, группа ученых во главе с профессором Кевином Шавински (Kevin Schawinski) из Швейцарской высшей технической школы Цюриха использовала принципы машинного обучения для создания алгоритма, способного распознавать на астрономических снимках образ галактики и восстанавливать из размытого изображения более четкое. Обученные нейронные сети позволили распознавать и реконструировать детали, которые не могут быть разрешены при помощи телескопа, в частности, звездообразовательные области, перемычки и пылевые полосы в галактиках.

Космический телескоп GAIA. Источник: hsto.org
Космический телескоп GAIA. Источник: hsto.org

А 26 июня 2017 года на встрече Европейского астрономического общества (EWASS) в Праге были представлены результаты еще одного исследования, проведенного при помощи сверхмощного космического телескопа GAIA (Global Astrometric Interferometer for Astrophysic), принадлежащего Европейскому космическому агентству. Он был отправлен в экспедицию по картографированию распределения звезд в галактике в 2013 году. Его задача состояла не только в создании трехмерной карты, но и в измерении параллакса и радиальной скорости 0,5% звезд Млечного пути (около одного миллиарда). Кроме того, GAIA занимался поиском экзопланет. В итоге телескопу удалось обнаружить 80 звезд, движущихся с высокой скоростью от центра галактики в сторону ее окраины.

Сверхбыстрые звезды трудно найти в звездном скоплении Млечного пути. Ранее ученым все же удалось обнаружить 20 высокоскоростных звезд, имеющих массу, в 2,5-4 раза превышающую массу Солнца. Но телескоп GAIA с его уникальными поисковыми возможностями, позволяющими переписать миллиарды звезд, представил возможность пополнить этот список. Систематизировать огромные объемы данных помогло применение искусственной нейронной сети. Как пояснил Томазо Маркетти (Tommaso Marchetti), аспирант Лейденского университета и автор статьи, описывающей результаты, опубликованные в ежемесячных уведомлениях «Королевского астрономического общества», после надлежащего обучения нейросеть научилась распознавать высокоскоростные светила в звездном каталоге, подобном тому, который составляется GAIA.

Ученые использовали новые алгоритмы для двух миллионов звезд и всего за один час нейросеть уменьшила набор данных до 20 000 потенциальных высокоскоростных звезд. Дальнейший отбор выявил 80 светил-кандидатов, путь шести из которых удалось проследить до центра Галактики. При этом удалось идентифицировать группу из 20 ранее открытых быстрых звезд. Они имеют массу сходную с Солнцем, а одна из них уже набрала скорость более 500 км/сек. Это означает, что она больше не связана гравитационным полем Галактики и вскоре может покинуть ее.

Новая порция данных от GAIA поступит в апреле 2018 года, до этого времени ученым еще предстоит модернизировать алгоритмы.

Обучение роботов

В прошлом году исследователи из Лаборатории X (ранее известной как Google X) разработали и протестировали систему, которая позволяет роботам ускоренно изучать выполнение одинаковых задач с помощью коллективного обучения (кратко об этом рассказывается в блоге Google, с препринтами статей можно ознакомиться на arXiv.org (1, 2, 3)). Как было показано в ходе эксперимента, методы глубокого обучения помогают роботам эффективно усвоить выполнение довольно сложных действий, в том числе связанных с моторикой. При наличии симулятора или готового набора данных этот процесс может быть относительно недолгим, в то время как на самостоятельное обучение с подкреплением в реальном мире одному роботу, как правило, требуется куда больше времени.

Во время эксперимента роботам предстояло обучаться одинаковой задаче — самостоятельному открыванию двери. Все роботы были объединены в одну сеть с центральным сервером, на котором производилось дополнительное обучение и хранилась актуальная версия нейросети. У каждого робота была своя копия нейросети, автономно работающая над задачей по открыванию двери с помощью дверной ручки.

В ходе первого эксперимента все двери находились в разном положении, и каждый робот работал со своей дверью. Управляющая каждым роботом копия центральной нейросети составляла последовательность будущих действий, причем на этом этапе инженеры специально искажали цепочку команд от сети к роботу посторонним шумом, чтобы увеличить диапазон выбранных значений. После этого робот делал очередную попытку открыть дверь.

Вся информация о выбранных нейросетью действиях, движениях робота и результатах каждой попытки отправлялась обратно на сервер. Эти данные использовались для дополнительной настройки центральной нейросети, после чего сервер рассылал роботам копию новой версии, которая работала немного лучше предыдущей, и вся операция повторялась сначала.

В результате проведенных экспериментов выяснилось, что даже два робота обучают нейросеть гораздо эффективнее, чем один робот. За два с половиной часа два робота достигли показателя в 100 процентов успешных попыток. В то же время робот, который работал в одиночестве, за тот же период научился лишь перемещать манипулятор к дверной ручке. Через четыре часа робот-одиночка научился открывать дверь только в 20 процентах случаев.

Контроль за популяцией редких видов животных

Использование нейросети помогло ученым из Университета Мердока (Австралия) следить за популяцией дюгоней, также известных как морские коровы. Это животное занесено в Красную книгу Международного союза охраны природы со статусом «уязвимый вид». Поэтому сегодня ученые с особой тщательностью подходят к контролю за его численностью и состоянием популяции. Морские коровы встречаются в водах к северу и западу Австралии, следить за ними помогают дроны — по снимкам ученые определяют численность и ареал распространения вида. Однако чтобы решить эти задачи, раньше специалистам приходилось вручную отсматривать десятки тысяч снимков в поисках фото с морскими коровами. Сделать это быстрее и эффективнее позволило использование нейросетей.

Дюгонь. Источник: mir-vpechatleniy.ru
Дюгонь. Источник: mir-vpechatleniy.ru

Эксперт по искусственному интеллекту в Квинслендском технологическом университете доктор Фредерик Мейр (Frederic Maire), используя TensorFlow (открытую программную библиотеку для машинного обучения от Google), натренировал сеть на распознавание морских коров на снимках с беспилотников. Теперь сеть может сканировать десятки тысяч фотографий воды и идентифицировать на снимках дюгоней. Затем результаты, выданные нейросетью, проверяет команда ученых. В будущем специалисты планируют применять технологию и для других целей. Одна из идей — использовать нейросеть для обнаружения акул вблизи побережий Австралии. Принцип работы останется тем же: программа должна будет распознавать снимки с акулами среди десятков тысяч фото пляжей, сделанных дронами. В случае обнаружения опасности спасателям будет отправляться сигнал оповещения.