Революция в искусственном интеллекте

Революция в искусственном интеллекте

22 февраля 2018 года, в доме Дружбы состоялся очередной семинар организованный НТО "Кахак". С докладом "Революция в искусственном интеллекте" выступил кандидат технических наук, Александр Пак.

IMG_0499

Ежедневно создается огромное количество новой информации и данных с помощью экономических, академических и социальных мероприятий, имеющих значительную потенциальную экономическую и социальную значимость. Например, глобальное научное сообщество ежегодно генерирует более 1,5 миллиона научных статей, очевидно, что человек не способен обрабатывать такой большой объем данных (BigData). Проблема преобразования накопленных данных в знания является нетривиальной задачей. Исторически сложилось так, что формулировка задачи для гипертекстовых документов была сформулирована в Семантической паутине в 1998 году Тимом Бернерс-Ли, когда текст (содержимое сайта) переводится вручную в набор троек (объект, объект, связь). По ряду причин реализация в то время была невозможна. Напротив, на сегодняшний день значительный прорыв в области углубленного обучения, а именно разработка сверточных и рекурсивных нейронных сетевых архитектур (LSTM, GRU, DCNN и др.) Похож на перспективный инструмент для обработки больших текстовых данных. Однако предлагаемые архитектуры при моделировании грамматики зависимости выявили ряд серьезных недостатков:

  1. вычислительная сложность обучения составляет более 3 градусов в зависимости от размера ввода;
  2. проблемы взрыва или исчезновения градиентов;
  3. зависимость от конкретной предметной области.

Действительно, симуляция синтаксиса для многомерного семантического пространства, где плотность распределения событий подчиняется степенному закону Ципфа, требует дополнительных механизмов:

  1. выравнивание статистики редких событий; 
  2. регуляризация градиентов; 
  3. улучшение сходимости.

Возможными решениями проблемы сходимости являются:

  1. свертка семантического пространства слов в классах семантической эквивалентности;
  2. внедрение модульной архитектуры нейронной сети;
  3. дополняя механизмы внимания и внутреннее состояние сети семантическим словом класса, что, естественно, поможет устранить омонимию.

Многие работы были посвящены построению текста для знания вычислительных систем. Все такие проекты объединены направлением Глубокого обучения и технологий: База знаний (база знаний) и Обработка естественного языка (обработка естественного языка). База знаний – это хранилище информации, где оно хранится не отдельно, а в контексте других блоков данных. И при извлечении данных из естественного языка – машины, которая сравнивает существительные с их сущностью, предложения – утверждения. Такое преобразование возможно не для какой-либо предметной области, а только там, где тексты подчиняются логическому дискурсу и действуют с фактами (например, юриспруденция, фармацевтика и другие точные науки).

1

2345678910

     к.т.н., Александр Пак.
 
IMG_0496
IMG_0498