Готовый перевод Xueba's military research system / Военная исследовательская система: Глава 758 Обучение на многообразиях

(Ctrl + влево) Предыдущая глава   |    Оглавление    |   Следующая глава (Ctrl + вправо)

Проблема, поднятая Яо Мэнной, не была сложной для понимания Чан Хаонанем.

Просто её трудно решить.

По сути, это затрагивает целый ряд вопросов: интеллектуальный анализ текста, визуализацию данных, поиск информации, интеллектуальный анализ данных, машинное обучение и даже искусственный интеллект.

Если бы удалось реализовать полностью автоматизированное производство, как задумала Яо Мэнна, это был бы уровень Индустрии 4.0.

В 1999 году это было явно нереально.

Но невозможность полной реализации всей этой системы не означает, что в ней нет элементов, которые можно использовать в качестве точки прорыва.

Например, интеллектуальный анализ данных и поиск информации были очень популярными направлениями исследований на рубеже тысячелетий.

Их основная цель - извлечь ценные знания из огромных баз данных и большого количества сложной информации, а также повысить эффективность использования информации.

На самом деле, ещё до перерождения Чан Хаонаня, эти технологии начали применяться в области проектирования и производства самолётов, и он сам имел с ними дело.

Но в то время он, как обычный инженер с техническим образованием, не обладал глубокими теоретическими знаниями.

А система, в первую очередь, требует построения полной и работоспособной концепции.

Это привело к тому, что сейчас в его голове был целый ворох терминов, но он не знал, какой из них является ключом к решению проблемы —

Фактически, он сам столкнулся с невозможностью извлечь ценную информацию из большого количества сложной информации.

"Информация..."

Чан Хаонань взял со стола лист бумаги и написал в самом центре два иероглифа.

В идеальной модели лучше всего, чтобы одно данное могло точно и однозначно описывать одно значение.

То есть одномерные данные.

Задачи, которые решают в начальной и средней школе, в основном такие.

В реальной жизни большинство проблем, с которыми мы сталкиваемся, тоже такого рода.

А для описания более сложных ситуаций, как правило, требуется набор данных.

Но в то же время этот набор данных зачастую может описывать не только одно значение.

Чтобы математически описать явление, когда один набор (несколько) данных соответствует нескольким значениям, необходимо развернуть этот набор данных в разных измерениях.

Это ситуация, когда математическая теория применяется к реальности.

И наоборот, информация, собранная в реальности, в большинстве случаев уже представляет собой развёрнутые многомерные данные.

И если мы хотим, чтобы компьютер обрабатывал эти многомерные данные…

Чан Хаонань задумался на некоторое время и записал на бумаге три основных условия:

1. Сжать исходные многомерные данные, уменьшить размерность исходных многомерных данных, тем самым сэкономив место для хранения, а также снизив вычислительную сложность многомерных данных.

2. Устранить или, по крайней мере, уменьшить шум, скрытый в исходных многомерных данных.

3. Извлечь высококачественные характеристики данных, улучшив эффективность последующего представления данных и задач классификации.

Он прокрутил эти три пункта в голове, а затем попытался получить от системы результат.

Реакции не последовало.

Очевидно, это нельзя было считать "полной и работоспособной" концепцией.

……

Незаметно Чан Хаонань просидел за своим столом до самого обеда.

И всё ещё не смог придумать хорошего решения.

Пока урчание в животе не вывело его из глубоких раздумий.

Он действительно проголодался.

Яо Мэнна взглянула на одно слово и три предложения на бумаге, и поняла, что у Чан Хаонаня, вероятно, нет идей, поэтому просто встала и сказала:

"Может, сначала пообедаем?"

"Хорошо."

Чан Хаонань не был из тех, кто упирается лбом в стену.

Более того, математика - это не та вещь, которую можно постичь одним лишь усердным размышлением.

Без вдохновения ничего не получится.

Лучше сначала расслабиться и сменить подход.

Пятнадцать минут спустя, трое (вместе с Чжу Ядань) уже сидели за круглым столом на втором этаже столовой.

Здесь была небольшая кухня, где готовили на заказ, цены были немного выше, чем в большой столовой внизу, к тому же нужно было подниматься на этаж выше, поэтому людей здесь было немного.

Зато в небольшом супермаркете рядом постоянно сновали люди.

Перед Чан Хаонанем стояла дымящаяся тарелка супа с лапшой и бараниной, но он не спешил браться за палочки, а задумчиво смотрел на толпу людей, поднимающихся и спускающихся по лестнице неподалеку.

В 90-е годы лапша быстрого приготовления была очень популярным продуктом.

Когда Чан Хаонань учился в бакалавриате, у всех были довольно стеснённые условия, и мало кто мог позволить себе такую роскошь.

Но к 99-му году иметь в общежитии несколько пакетов или даже ящик лапши быстрого приготовления уже не было чем-то необычным.

"Как вы думаете..."

Внезапно начал Чан Хаонань:

"Как производители лапши быстрого приготовления гарантируют, что не забудут положить пакетик с приправой или не положат лишний?"

Яо Мэнна, которая ела, опустив голову, на мгновение замерла, а затем поняла, что Чан Хаонань всё ещё размышляет над вопросом, который она задала ранее.

Положить пакетик с приправой в лапшу быстрого приготовления и заклепать заклёпку на самолёте - с точки зрения математической модели это примерно одно и то же.

И производители лапши быстрого приготовления, очевидно, вряд ли имеют какое-то очень высокотехнологичное оборудование и технологии.

"Наверное... взвешивают?"

Предположила Яо Мэнна:

"Пакетик с приправой составляет около 10% от веса всей упаковки лапши, поэтому, если положить меньше или больше, это должно быть легко обнаружить."

"Хм... но вес самой лапши имеет погрешность, и есть несколько видов пакетиков с приправами, взвешивание может только доказать, что общий вес в норме, но не гарантирует, что не положили не тот пакетик..."

Чан Хаонань покачал головой и возразил.

Сидящая рядом Чжу Ядань посмотрела налево на Чан Хаонаня, направо на Яо Мэнну, и никак не могла понять, почему эти двое вдруг начали обсуждать этот вопрос.

"Ну..."

Хотя ей казалось, что она лезет со своим уставом в чужой монастырь перед двумя докторами наук, но в конце концов она не удержалась:

"Разве нельзя просто поставить человека рядом с конвейером перед этапом упаковки, чтобы он следил?"

Яо Мэнна приложила руку ко лбу:

"Мы как раз думаем, как можно обойтись без этого человека, но добиться того же эффекта."

"Это..."

Чжу Ядань тут же втянула голову:

"Я просто так сказала... но иногда роль человеческого мозга, возможно, всё ещё невозможно заменить..."

Вокруг стола снова воцарилась тишина, лишь изредка раздавалось слабое чавканье.

Но Чан Хаонань всё ещё не притронулся к еде.

"Ты права."

Через несколько минут, когда Чжу Ядань уже почти доела жареную лапшу в своей тарелке, Чан Хаонань внезапно сказал:

"Человеческий мозг способен каким-то образом анализировать многомерные данные, чтобы получать представление о внешнем мире."

"?"

Чжу Ядань подняла голову с кучей вопросительных знаков, но, видя, что Чан Хаонань задумался, проявила самосознание и не стала мешать.

"Другими словами, внешняя информация высокой размерности обязательно скрыта в нелинейной структуре многообразия в пространстве низкой размерности..."

Почти 70 лет назад американский статистик Гарольд Хоттелинг уже предлагал метод анализа главных компонент для уменьшения размерности многомерных данных.

Он считал, что чем больше дисперсия, тем больше информации она предоставляет, и наоборот, поэтому он строил несколько главных компонент с большой дисперсией и большим количеством информации посредством линейной комбинации исходных компонент, а затем выполнял сингулярное разложение матрицы, чтобы уменьшить размерность данных.

Но метод анализа главных компонент эквивалентен нахождению оптимального линейного отображения только в смысле наименьшего расстояния проекции, а в реальности не так много простых линейных задач.

Однако эту идею можно позаимствовать.

Чан Хаонань отставил тарелку с супом и лапшой, из которой отхлебнул лишь раз, вскочил и быстро вышел из столовой.

Чжу Ядань, на которой лежала ответственность за безопасность, поспешно последовала за ним.

Яо Мэнна среагировала немного медленнее, только встала, как вспомнила, что ещё не расплатилась, поэтому ей пришлось достать кошелёк и с досадой направиться к кассе.

Вернувшись в кабинет, Чан Хаонань снова нашёл тот самый лист бумаги.

Под тремя основными условиями он написал ещё несколько строк.

Задан набор многомерных данных X={x1, x2, …, xn}RD, где n — количество выборок данных, D — размерность многомерных данных.

Затем предположим, что выборки данных в X взяты или приблизительно взяты из данных Y={y1, y2, …, yn}Rd в пространстве вложения низкой размерности.

Найти отношение отображения из пространства наблюдения высокой размерности в пространство вложения низкой размерности, такое, что yi=(xi), и взаимно однозначное отношение отображения реконструкции ^-1, такое, что xi=^-1(yi).

Дописав до этого места, Чан Хаонань удовлетворённо улыбнулся.

Хотя он всё ещё не изложил полную идею, но, по крайней мере, он уже разложил три абстрактных основных условия на конкретную математическую задачу.

А для теоретических исследований чёткая постановка проблемы почти эквивалентна половине пути к успеху.

Подумав об этом, он вернулся к началу этого листа и снова написал шесть иероглифов.

Метод обучения на многообразиях.

http://tl.rulate.ru/book/129535/5658281

(Ctrl + влево) Предыдущая глава   |    Оглавление    |   Следующая глава (Ctrl + вправо)

Обсуждение главы:

Еще никто не написал комментариев...
Чтобы оставлять комментарии Войдите или Зарегистрируйтесь

Инструменты
Настройки

Готово:

100.00% КП = 1.0

Скачать как .txt файл
Скачать как .fb2 файл
Скачать как .docx файл
Скачать как .pdf файл
Ссылка на эту страницу
Оглавление перевода
Интерфейс перевода