Пришелец! Приветствуем Вас на сайте Клана Дедов. Сегодня Суббота, 19.08.2017.
          Стать участником Клана  ·   Войти на сайт  ·   Информация о Нас
         номер нашего счета в системе яндекс-деньги 41001282367910

   Просмотры   
   Обсуждения   
Главная » 2011 » Декабрь » 7 » В США названы лучшие восстановители измельчённых документов
В США названы лучшие восстановители измельчённых документов

10:37:20 07.12.2011

Победитель соревнования по реконструкции текстов, пропущенных через шредер, стал известен намного раньше, чем ожидалось. Чемпионы-сыщики проявили изобретательность и смекалку.

Стартовавший в конце октября конкурс по воссозданию измельчённых документов Shredder Challenge завершён.

Первое место и призовые $50 тысяч завоевала команда программистов из Сан-Франциско под названием «Все ваши обрезки принадлежат США» (All Your Shreds Are Belong To U.S.). Она быстрее и точнее соперников собрала все пять пазлов, то есть документов, разрезанных в общей сумме на 10 тысяч тонких полосок. И ещё она первой ответила на связанные с загадками вопросы относительно городов и людей, упоминаемых в текстах.



Исходный и реконструированный победителем текст номер 1. Он был разбит всего на 224 кусочка (дальше степень измельчения пазлов шла по нарастающей), потому данную бумагу команда собрала уже 6 ноября (иллюстрация Shredder Challenge/DARPA).

Ключом к успешному решению задания оказалось сочетание чисто машинного подхода (сортировка и сравнение фрагментов) с творческой работой людей-сборщиков, сообщает устроившее конкурс агентство DARPA. Программа-победитель подбирала отсканированные кусочки бумаг друг к другу лишь вчерне и предъявляла пары для проверки членам команды.

Последние не просто по буквам отслеживали верные сочетания соседних полосок, а использовали по ходу восстановления документов разбросанные по ним подсказки, то есть обращали внимание на смысл складывающихся головоломок.

К примеру, в первом тексте упоминается название фильма, который снял режиссёр Анатоль Литвак в 1937 году. В энциклопедии можно узнать, что в данном году Литвак выпустил две ленты – «Товарищ» и «Женщина, которую я люблю». Товарищ по-английски – comrade, и это как раз то слово, с которого начинается первый документ.



Загадка номер пять была самой сложной во всей серии. Здесь было разрезано и перемешано сразу три листка бумаги (на фото показан только третий — до измельчения и после восстановления).

Один из трёх листов был исполосован в направлении, перпендикулярном двум другим, а общее число кусочков составило более шести тысяч! Вдобавок небольшая часть текста представляла собой морзянку в виде нагромождения повторяющихся слов dit и dah. Над этой головоломкой команда победителей колдовала до 29 ноября (иллюстрация Shredder Challenge/DARPA).

Собрав третий документ (на фото под заголовком), участники должны были назвать судьям задуманный в загадке город — Сьенфуэгос.

Интересно, что напрямую в документе этот город не упоминался, но зато там были указаны географические координаты Гаваны, нарисованы очертания Кубы и дан набросок весьма известного городского парка Сьенфуэгоса.



Исходный документ номер 3 и скрытые в нём подсказки. Данная бумага была разрезана на 1115 кусочков (иллюстрация Shredder Challenge/DARPA).

При выборе победителя учитывалось не только первенство в сборке пазлов. За те или иные правильные ответы на вопросы по содержанию документов судьи начисляли дополнительные баллы. Группа All Your Shreds Are Belong To U.S. оказалась лучшей не только в деле программирования, но и просто эрудиции, сообразительности.



Задача номер два. Умеренное число обрывков – всего 373 — позволило победителям восстановить этот документ быстро и практически на 100% (иллюстрация Shredder Challenge/DARPA).

Своё последнее решение из серии заданий команда из Сан-Франциско прислала всего через 33 дня после анонса конкурса. На составление алгоритма машинного зрения и сортировки обрывков, а также собственно на сборку бумаг умельцы потратили 600 человеко-часов.

Между тем перед стартом соревнования некоторые эксперты DARPA считали предложенные загадки практически нерешаемыми, во всяком случае в столь сжатые сроки.

Однако победители не только опровергли все прогнозы, но и наглядно показали, как из измельчённой мешанины бумаг можно извлекать читабельный текст и разбираться в его смысле даже при недостаче частей документа. А ведь именно это и было нужно инициаторам конкурса, представлявшим интересы военных и спецслужб.



Четвёртый пазл (порезанный на 2340 кусочков) поддался победителям лишь частично. Но и восстановленных фрагментов хватило для того, чтобы узнать «имена учёных», работавщих над «секретным проектом» (иллюстрация Shredder Challenge/DARPA).

Леонид Попов, 5 декабря 2011, membrana.ru
Категория: Железо | Просмотров: 129 | Добавил: Insiderus
Всего комментариев: 0
Добавлять комментарии могут только зарегистрированные пользователи.
[ Регистрация | Вход ]
    Счётчик тИЦ и PR      Rambler's Top100
Хостинг от uCoz