В каждом случае один нуклеотид кодирует один бит данных - азотистые основания аденин (А) и цитозин (С) обозначают логическую "единицу", а гуанин (G) и тимин (T) - логический ноль
hms.harvard.edu
В США биоинженеры нанесли текст книги из 53 тысяч слов на молекулы ДНК, а затем прочитали его при помощи устройства секвенирования, достигнув рекордной плотности записи информации - 5,5 петабит на кубический миллиметр, сообщает РИА "Новости" со ссылкой на журнал Science.

Ученые пытаются приспособить молекулы ДНК для хранения произвольных данных с 1988 года, когда американским биоинформатикам впервые удалось записать 7,9 килобайт информации на молекулу ДНК и прочитать ее.

Исследователи под руководством Шрирама Косури из Гарвардской медицинской школы в Бостоне разработала особый компьютерный алгоритм, позволяющий сжать и подготовить для записи на молекулу ДНК практически неограниченный объем информации.

Чтобы нанести запись, данные разбивают на равные куски и записывают на короткие фрагменты ДНК длиной в 159 нуклеотидов. Каждый такой блок содержит 96 бит данных, 19-битный адрес блока и два фрагмента по 22 бита, кодирующих начало и конец информационного отрывка. В каждом случае один нуклеотид кодирует один бит данных - азотистые основания аденин (А) и цитозин (С) обозначают логическую "единицу", а гуанин (G) и тимин (T) - логический ноль.

Как отмечается в материале, опубликованном в Science, при записи информации блоки синтезируются из отдельных нуклеотидов при помощи струйного ДНК-принтера. Наличие адреса у каждого блока позволяет хранить информацию в виде смеси из коротких последовательностей нуклеотидов, а не единой цепочки ДНК. Такая методика позволяет хранить практически неограниченный объем информации.

Ученые нанесли на молекулы ДНК электронную версию книги "Регенезис: как синтетическая биология переизобретет природу и нас самих" ученого Джорджа Черчя, входящего в группу исследователей, и писателя Эда Реджиса.

Электронная версия этой книги содержит в себе 5,27 мегабит (658 килобайт) информации, в том числе 53,5 тысячи слов, 11 картинок и 1 ява-скрипт. Ученые синтезировали необходимые фрагменты ДНК, смешали их, размножили и прочитали при помощи устройства секвенирования Illumina HiSeq. Как отмечается я в статье, книга была считана всего с десятью ошибками на 5,27 мегабит данных.

По мнению ученых, ДНК может стать одним из основных способов хранения информации в архивах и для других целей, не требующих быстрого доступа к данным. Ведь плотность записи при этом превышает характеристики флеш-памяти и жестких дисков в миллионы раз, а аналогичную характеристику в квантовой голографии - в сотни раз.