Ученые смогли сохранить в ДНК 151 килобайт картинок

Новости
17:21, 8 апреля
798
0
Поделиться

Сотрудники исследовательского  подразделения Microsoft и университета Вашингтона усовершенствовали методику хранения данных в молекулах ДНК. Им удалось сохранить и затем прочитать четыре графических файла размером от пяти до 24 килобайт. Об этом в пятницу, 8 апреля, сообщает N+1. 

Тема хранения информации в ДНК вызывает интерес ученых по двум причинам: из-за высокой плотности (по примерным расчетам — до эксабайта, или миллиарда гигабайт, на кубический миллиметр) и надежности (период полужизни более 500 лет). Обращение к хранилищу производится существующими методиками синтеза ДНК (запись), ПЦР-амплификации и секвенирования (считывание).

На данный момент хранить данные таким образом слишком дорого, однако стоимость подобных технологий быстро снижается. 

Физической единицей хранения данных является последовательность из 100-200 нуклеотидов, которые содержат 500-100 бит. Таким образом, для хранения объекта данных необходимо множество таких фрагментов, собранных в пул.

Исследователи выбрали простую архитектуру ключ-значение (имя файла — содержимое файла). Ключом служит пара праймеров ПЦР, указывающих, какие именно фрагменты ДНК подлежат считыванию, то есть позволяющих проводить адресацию с произвольным доступом.

Проблема, стоящая перед учеными, состоит в том, что существующие технологии синтеза и секвенирования ДНК не защищены от ошибок, которые составляют до одного процента нуклеотидной последовательности. Чтобы преодолеть ее использовали модифицированное кодирование Голдмэна. Каждый олигонуклеотид с праймерами сохраняли в трех копиях. Доступ к ним производили с помощью логического оператора XOR, который позволяет по двум любым фрагментам ДНК восстановить третий.

Как отмечают исследователи, уровень такой избыточности хранения поддается настройке для достижения необходимой точности воспроизведения данных.

В ходе эксперимента ученых удалось записать в ДНК четыре графических файла. Каждый файл сохранили в двух копиях — кодированием Голдмэна и XOR-кодированием. В сумме восемь операций записи произвели 45 652 последовательности из 12 нуклеотидов общей емкостью 151 килобайт. После этого файлы успешно восстановили. 

Уже подписчик?
Дождь в вашей почте
Нажав кнопку подписаться, я соглашаюсь получать электронные письма от телеканала Дождь и соглашаюсь с тем, что письма могут содержать информацию рекламного характера.
Дождь в вашей почте
Нажав кнопку подписаться, я соглашаюсь получать электронные письма от телеканала Дождь и соглашаюсь с тем, что письма могут содержать информацию рекламного характера.