Новый подход глубокого обучения под названием DeepCubeA может решить кубик Рубика за несколько секунд. Модель глубокого обучения может быть применена к различным другим областям, включая робототехнику и естественные науки.
Искусственный интеллект (ИИ) уже доказал свою успешность в шахматах и го , но более сложные головоломки, такие как кубик Рубика, не были решены с помощью машинного интеллекта. Это классическая комбинационная головоломка, которая ставит уникальные и интригующие задачи для машинного обучения.
Хотя методы машинного обучения ранее использовались для решения кубика Рубика, они не смогли эффективно и надежно решить головоломку. Кроме того, эти методы должны были опираться на знания конкретной области.
Теперь исследователи из Калифорнийского университета в Ирвине создали метод глубокого обучения под названием DeepCubeA, который может решить невероятно сложную головоломку без каких-либо знаний в конкретной области. Он может решить кубик Рубика в течение нескольких секунд без участия людей в игре.
По мере увеличения размеров, сложность лежащей в основе комбинаторной головоломки резко возрастает. Например, нахождение оптимального решения для 15 головоломок на обычном компьютере занимает доли секунды, тогда как нахождение оптимального решения для 24 головоломок может занять несколько дней на той же машине.
В этом исследовании исследователи попытались разработать модель машинного обучения, которая может научиться решать различные головоломки, не полагаясь на предметно-ориентированные человеческие знания. Они объединили три современных подхода к разработке DeepCubeA —
- Глубокое обучение
- Классическое подкрепление (итерация приближенного значения)
- Методы поиска пути (вес А* поиск)
Он состоит из алгоритма глубокого обучения, который использует функцию политики и значения в сочетании с поиском по дереву Монте-Карло для решения кубика Рубика.
Исследователи использовали систему глубокого обучения TensorFlow для обучения сети — ее обучили примерно 10 миллиардам симуляций скремблированной и завершенной головоломки. Весь процесс был выполнен за 1 000 000 итераций, что заняло 36 часов.
После обучения DeepCubeA смог достичь 100% точности во время каждой конфигурации теста, найдя кратчайший путь к конечному состоянию в 60,3% случаев.
DeepCubeA использует эвристическую функцию, которая никогда не переоценивает стоимость кратчайшего пути. Взвешенный поиск A * имеет определенные границы того, насколько длина решения может отличаться от длины оптимального решения.
Приложения помимо комбинаторных головоломок
Исследовательская группа также обучила DeepCubeA другим головоломкам, включая 24 головоломки, Lights Out и Sokoban. Он смог найти кратчайший путь в большинстве проверяемых случаев.
Конечная цель исследований [как этот] состоит в том, чтобы разработать модели глубокого обучения следующего поколения, которые могут быть применены в областях вне комбинационных загадок, от робототехники до естественных наук.
Мы уже ежедневно взаимодействуем с ИИ через поисковые системы и приложения, такие как Alexa и Siri. Тем не менее эти системы не очень умные: ими легко манипулировать или обмануть.
Нам нужно создать ИИ, который был бы более надежным, умным и способным понимать, рассуждать и планировать. Исследование — маленький шаг к этой огромной цели.