Ученые смогли сохранить в ДНК 151 килобайт картинок
Сотрудники исследовательского подразделения Microsoft и университета Вашингтона усовершенствовали методику хранения данных в молекулах ДНК. Им удалось сохранить и затем прочитать четыре графических файла размером от пяти до 24 килобайт. Об этом в пятницу, 8 апреля, сообщает N+1.
Тема хранения информации в ДНК вызывает интерес ученых по двум причинам: из-за высокой плотности (по примерным расчетам — до эксабайта, или миллиарда гигабайт, на кубический миллиметр) и надежности (период полужизни более 500 лет). Обращение к хранилищу производится существующими методиками синтеза ДНК (запись), ПЦР-амплификации и секвенирования (считывание).
На данный момент хранить данные таким образом слишком дорого, однако стоимость подобных технологий быстро снижается.
Физической единицей хранения данных является последовательность из 100-200 нуклеотидов, которые содержат 500-100 бит. Таким образом, для хранения объекта данных необходимо множество таких фрагментов, собранных в пул.
Исследователи выбрали простую архитектуру ключ-значение (имя файла — содержимое файла). Ключом служит пара праймеров ПЦР, указывающих, какие именно фрагменты ДНК подлежат считыванию, то есть позволяющих проводить адресацию с произвольным доступом.
Проблема, стоящая перед учеными, состоит в том, что существующие технологии синтеза и секвенирования ДНК не защищены от ошибок, которые составляют до одного процента нуклеотидной последовательности. Чтобы преодолеть ее использовали модифицированное кодирование Голдмэна. Каждый олигонуклеотид с праймерами сохраняли в трех копиях. Доступ к ним производили с помощью логического оператора XOR, который позволяет по двум любым фрагментам ДНК восстановить третий.
Как отмечают исследователи, уровень такой избыточности хранения поддается настройке для достижения необходимой точности воспроизведения данных.
В ходе эксперимента ученых удалось записать в ДНК четыре графических файла. Каждый файл сохранили в двух копиях — кодированием Голдмэна и XOR-кодированием. В сумме восемь операций записи произвели 45 652 последовательности из 12 нуклеотидов общей емкостью 151 килобайт. После этого файлы успешно восстановили.