Data Science, Machine Learning

2 сентября 2015
от

Интервью «эксперта» с академиком РАН, директором Института проблем передачи информации им. А. А. Харкевича РАН Александром Петровичем  Кулешовым

Ваш институт, если судить даже просто по названиям его лабораторий, поражает разнообразием направлений. Иногда непонятно, какое отношение иные из них имеют к тематике института. Что их объединяет? 

— Математика. Все это объединяет математика. Даже наши биологи, физиологи, специалисты по зрительным системам — это в основном переучившиеся математики, переучившиеся физики. Я, например, получил на мехмате МГУ лучшее, не побоюсь этого слова, математическое образование в стране, а когда я учился, оно было лучшим в мире. Но я никогда не работал математиком, я всегда работал инженером. Я математик, переучившийся на инженера. Хотя я много раз в жизни доказывал теоремы, и не только для диссертации. А потому, что это было нужно для достижения практического результата. Потому, что инженерная деятельность сейчас очень математизирована. Все произошло правильно, и я стал хорошим инженером именно благодаря математике.

И такой тренд становится все более распространенным, поскольку сейчас все серьезные успехи в науке и технике связаны с решением междисциплинарных задач. Я люблю приводить малоизвестный широкому кругу людей факт: больше всего Нобелевских премий во всех областях науки получила томография. Она шла по разным направлениям — по физике, по физиологии, медицине.

Что такое томография? Два человека, Феликс Блох и Эдвард Пёрселл, в свое время вдруг поняли, что можно объединить возможности трех уже известных достижений науки. Первое —это преобразования Радона. Это очень просто на самом деле: используя обратное преобразование Радона, ты можешь восстановить трехмерное тело по площадям его сечений. Второе — это тот факт, что по функции ослабления рентгеновского сигнала, проходящего через тело, можно определить «площадь» такого сечения. Третье —наличие уже в то время компьютеров, на которых можно численным образом получить решение обратной задачи и, тем самым, собственно, ту томограмму, которую мы все знаем. Вот все это сошлось у них в голове, и получился томограф. В этом не было ничего принципиально нового, а получилось нечто уникальное, в основе чего лежат в первую очередь результаты математики. И если мы проанализируем все главные достижения человечества, это всегда междисциплинарные задачи. А наш институт — пример воплощения такой междисциплинарности, когда люди из разных областей знаний варятся в одних семинарах, разговаривают и работают друг с другом.

— Вы говорите, что математика объединяет все. Какая-то конкретная область математики?

— Чтобы было понятно, нужно рассказать историю института. В следующем году ему исполнится пятьдесят пять лет. А еще раньше это была лаборатория по разработке научных проблем проводной связи, которой руководил генерал Коваленков. Началась новая эпоха связи, стране нужна была теория кодирования. Теория кодирования — это математика в чистом виде: алгебра, комбинаторика и теория вероятностей. Для этого нужно было набирать математиков. А получилось так, что в советское время в Стекловку (Математический институт им. В. А. Стеклова РАН. — «Эксперт») евреев не брали, и не потому, что была такая команда партии и правительства, а потому, что там был такой человек во главе. И очень многие талантливые математики пришли на работу в наш институт. В итоге сформировалась очень сильная математическая школа. Из нашего института вышло три филдсовских лауреата: Григорий Маргулис, Максим Концевич, Андрей Окуньков. Мы чемпионы по этому показателю в мире. У нас работает лауреат Премии Абеля — академик Яков Григорьевич Синай. Максим Львович Концевич — член Французской академии, двукратный лауреат Мильнеровской премии. Но он до сих пор пишет в дирекцию служебные записки: «Прошу предоставить мне отпуск за свой счет». Летом, а иногда и зимой, они обычно приезжают, ведут семинары, работают с молодежью.

Но меняются времена — меняются и «лидирующие» математические дисциплины. Сегодня для нас это анализ данных, или интеллектуальный анализ данных, Data Science, Machine Learning. Это наука, которая действительно объединяет абсолютно все направления в нашем институте.

Если взять общий объем данных, находящихся в мировом совокупном storage (совокупное компьютерное пространство для хранения документов. — «Эксперт»), то 90 процентов из них появились за последние два года. Фантастическая цифра, но это правда. Оказалось, что из этих данных можно много что извлечь, и эта технологическая возможность породила новые математические задачи. Это, например, так называемое распознавание многообразий в многомерных пространствах. Если хотите, это извлечение новых знаний из больших объемов информации. Причем в самых различных областях человеческой деятельности, от машиностроения до социологии. Сейчас активно обсуждается интеллектуальный анализ видеопотоков. Человек делает ошибки при распознавании изображений в пяти процентах случаев, а современная система Deep Learning делает ошибки в шести процентах. Это совершенно фантастическая вещь, к первым результатам в которой мы сейчас близки. Я не могу сказать, что эту задачу уже умеют решать очень хорошо, но это уже очень близко. В ближайшие годы это все перевернет нашу жизнь. Мы находимся на пороге новой технологической революции. Ее волна уже видна.

Новые возможности, которые предоставляет data science, вызывает в мире очень сложные тектонические процессы. Сейчас для многого еще нет устоявшихся названий, иногда употребляют термин «технологический интернет», который предоставляет широкому кругу пользователей совершенно новые возможности. Ты говоришь: «Я хочу кресло. На четырех ножках, максимальный уровень отклонения 150 градусов, минимальный — 110, мой вес — 100 килограммов». И тебе из огромного набора 3D-моделей кресла в интернете подбирают подходящее. А если нет, то автоматическим образом конструируют то, что тебе надо.

В результате возникает гигантская проблема: те самые люди средней квалификации — «синие воротнички», которые раньше занимались такого рода рутинной работой, — начинают исчезать. В мире сейчас примерно 70 миллионов конструкторов, из них всего один процент (будем в соответствии с принятой сейчас международной практикой называть их экспертами) способны работать со сложными инженерными софтами — средствами проектирования. А проектируется масса чего — от садовых домиков и велосипедов до ракет и атомных станций. И постепенно сжимается пространство для людей средней квалификации. Тот, кто всю жизнь рисовал болты и гайки, сейчас никому не нужен. И не нужны студенты, которых к этому готовят. Их некуда деть. Это общемировая проблема.

Едешь в Париже мимо огромных корпусов «Пежо», «Рено», «Ситроена», раньше там пол-Парижа работало, а сейчас в цеху работают несколько человек и манипуляторы. Уже обещали к 2020 году сделать машину без водителя. Может, к 2025-му. Знаете, сколько в нашей стране водителей? Несколько миллионов, по-моему. Что станет с этими людьми?1 Человеческое развитие не успевает за технологической революцией. Я всегда говорю, что у биологической эволюции квант — двадцать пять лет, а у технологической — три-четыре. Максимум пять.

Выиграет тот, кто получил хорошее образование, выиграет та страна, в которой это образование можно получить. В этих условиях снижать расходы на образование, снижать его уровень, снижать расходы на науку, как это происходит у нас, просто преступление перед собственным народом. Я подозреваю, что за последние двадцать пять лет страна стала раз в сто глупее. Цифра, конечно, условная, но она, мне кажется, не очень далека от реальности. Потому что падает уровень образования, потому что постоянно уезжают самые умные и молодые. Или идут совершенно не туда.

 

Академик РАН, директор Института проблем передачи информации им. А.А. Харкевича РАН Александр Кулешов zzzzzzzzzzzzzzzzzzzzzzznauka2.jpg

Академик РАН, директор Института проблем передачи информации им. А.А. Харкевича РАН Александр Кулешов

— Возвращаясь к вашему институту. Какие вы бы выделили основные достижения, то, чем вы гордитесь как безусловным масштабным достижением?

— Все просто: в мире сейчас применяется шесть систем кодирования, две с половиной из них созданы в этом институте. В частности, в нашем институте были разработаны алгебро-геометрические коды, обобщенные сверточные коды. Это признано всем миром. Что значит «с половиной», сейчас объясню. CDMA, американский стандарт мобильной связи, разработан в Qualcomm, но рассчитан и обоснован он профессором Зигангировым с коллегами. И это признает весь мир. Несколько лет назад мы проводили в России, в Петербурге, всемирный симпозиум IEEE, посвященный теории информации. IEEE — это самая крупная международная инженерная организация, создатель большинства мировых стандартов в области IT. Мы были организаторами. Это огромная честь. Потому что наши заслуги в этой области признаны всем миром. Институт создавался для этого, и мы эту задачу выполнили.

— Сейчас много говорят о проблеме импортозамещения в области инженерного программного обеспечения, которым у вас в институте тоже занимаются. Насколько мы готовы занять место на этом поле?

— Я недавно посмотрел CIMdata Report — это самая авторитетная консалтинговая компания, которая занимается PLM-системами, инженерным софтом. Там была дана общая оценка того, сколько нужно человеко-лет для создания всех тех средств инженерного софта, которыми сегодня пользуются в мире. Ответ знаете какой? 750 тысяч человеко-лет. То есть проблема не в деньгах. Даже если мы бы завалили всю страну долларами, это ничего не поменяет. Мы не в состоянии делать все то, что делает вокруг нас весь мир. Половина нашей промышленности работает в 3D-CAD на системе CATIA, а вторая половина — на Unigraphics. CATIA делается на моих глазах тридцать лет огромным коллективом в четыре тысячи человек. Откуда мы все это возьмем? Не надо фантазий.

Знаете, сколько попыток было сделать отечественные ERP-системы вместо, скажем, SAP? Были какие-то «Галактики», «Паруса». Где они? Понятно, почему 1C для бухгалтерии уцелела. Потому, что у нас в России специфическая бухгалтерия.

Проблема здесь не в том, что мы принципиально это сделать не можем, а в том, что у нас очень маленький рынок. Наш рынок софта составляет полтора-два процента мирового. На таком рынке невозможно выжить. Можно сконцентрировать ресурсы и сделать что-то одноразово, но, когда рядом с тобой идут поезда со скоростью 300 километров в час, а ты тащишься со скорость арбы, ты все равно отстанешь. Нужен экономический ресурс, чтобы на этой площадке развивать свою систему, а на нашей площадке его нет. Экономики для этого нет. Этого не хотят понять. На этом рынке нет экономического ресурса.

Как китайцы начали развиваться? Чтобы выжить самим, они стали поддерживать экспорт. Нужно поддерживать то, что покупается за рубежом, в мире. Это и будет импортозамещение. Импортозамещение — это ориентация на экспорт со стороны государства. Нужно поддерживать те компании, которые могут работать на международных рынках, но остаются здесь. Это наше, останется нашим, никто не сможет наложить никаких санкций. Это и есть импортозамещение. И эти компании сами по себе будут развиваться, потому что они экспортируют. У них рынок — весь мир. Прекрасный пример — «Лаборатория Касперского», продукцию которой покупают миллионы людей во всем мире.

Материал полностью

Метки: , ,

Версия для печати Версия для печати

Написать ответ

 
SSD Optimize WordPress UA-18550858-1