Победитель соревнования по реконструкции текстов, пропущенных через шредер, стал известен намного раньше, чем ожидалось. Чемпионы-сыщики проявили изобретательность и смекалку.
Стартовавший в конце октября конкурс по воссозданию измельчённых документов
Shredder Challenge завершён.
Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.
Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA). Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков,
сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.
Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.
К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.
Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления). Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah. Над этой головоломкой команда победителей колдовала до 29 ноября (иллюстрация Shredder Challenge/DARPA). Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос.
Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.
Исходный документ номер 3 и скрытые в нём подсказки. Данная бумага была разрезана на 1115 кусочков (иллюстрация Shredder Challenge/DARPA). При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.
Задача номер два. Умеренное число обрывков – всего 373 — позволило победителям восстановить этот документ быстро и практически на 100% (иллюстрация Shredder Challenge/DARPA). Своё последнее решение из серии заданий команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также собственно на сборку бумаг умельцы потратили 600 человеко-часов.
Между тем перед стартом соревнования некоторые эксперты DARPA считали предложенные загадки практически нерешаемыми, во всяком случае в столь сжатые сроки.
Однако победители не только опровергли все прогнозы, но и наглядно показали, как из измельчённой мешанины бумаг можно извлекать читабельный текст и разбираться в его смысле даже при недостаче частей документа. А ведь именно это и было нужно инициаторам конкурса, представлявшим интересы военных и спецслужб.
Четвёртый пазл (порезанный на 2340 кусочков) поддался победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена учёных», работавщих над «секретным проектом» (иллюстрация Shredder Challenge/DARPA). Леонид Попов, 5 декабря 2011, membrana.ru