Хранение цифровых данных ДНК - DNA digital data storage

Хранение цифровых данных ДНК это процесс кодирования и декодирования двоичных данных в и из синтезированных цепочек ДНК.[1][2]

Хотя ДНК как носитель информации имеет огромный потенциал из-за высокой плотности хранения, ее практическое использование в настоящее время сильно ограничено из-за ее высокой стоимости и очень медленного времени чтения и записи.[3]

В июне 2019 года ученые сообщили, что все 16 ГБ текста из Википедии Англоязычная версия была закодирована в синтетическая ДНК.[4]

Без клетки

В настоящее время наиболее распространенной технологией секвенирования ДНК является технология, разработанная Иллюмина который включает иммобилизацию одноцепочечной ДНК на твердой подложке, полимеразной цепной реакции (ПЦР) амплификация последовательностей и мечение отдельных оснований ДНК комплементарными основаниями, помеченными флуоресцентными маркерами (см. Секвенирование красителей Illumina ). Затем образец флуоресценции (разный цвет для каждого из четырех оснований ДНК) можно зафиксировать на изображении и обработать для определения последовательности ДНК.[1] Недавно разработанной альтернативой является нанопора технология, в которой молекулы ДНК проходят через поры наноразмеров под контролем храпового фермента. Прохождение молекул ДНК вызывает небольшое изменение электрического тока, которое можно измерить. Основное преимущество технологии нанопор состоит в том, что их можно читать в реальном времени.[1] Однако точность чтения этой технологии в настоящее время недостаточна для хранения данных.[5]

В естественных условиях

Генетический код живых организмов потенциально может использоваться для хранения информации. более того синтетическая биология может использоваться для создания клеток с «молекулярными регистраторами», позволяющими хранить и извлекать информацию, хранящуюся в генетическом материале клетки.[1] Редактирование генов CRISPR также может использоваться для вставки искусственных последовательностей ДНК в геном клетки.[1]

История

Идея хранения цифровых данных ДНК возникла в 1959 году, когда физик Ричард П. Фейнман в своей книге «Внизу много места: приглашение войти в новую область физики» обрисовал общие перспективы создания искусственных объектов. похожи на объекты микромира (в том числе биологические) и имеющие аналогичные или даже более обширные возможности.[6] В 1964-65 Михаил Самойлович Нейман,[7] Советский физик опубликовал 3 статьи о микроминиатюризации в электронике на молекулярно-атомном уровне, в которых независимо представлены общие соображения и некоторые расчеты, касающиеся возможности записи, хранения и поиска информации о синтезированных молекулах ДНК и РНК.[8][9][10] После выхода в свет первой книги М.С. Статья Неймана и после получения редактором рукописи его второй статьи (8 января 1964 г., как указано в этой статье) были опубликованы интервью с кибернетиком Норбертом Винером.[11] Н. Винер высказал идеи о миниатюризации компьютерной памяти, близкие к идеям, независимо предложенным М. С. Нейманом. Об этих идеях Винера М. С. Нейман упоминал в третьей статье.

Одно из первых применений хранения ДНК произошло в 1988 году в сотрудничестве между художником Джо Дэвисом и исследователями из Гарварда. Изображение, хранящееся в последовательности ДНК в Кишечная палочка, был организован в матрицу 5 x 7, которая после расшифровки образовывала изображение древней германской руны, представляющей жизнь и женскую Землю. В матрице единицы соответствуют темным пикселям, а нули - светлым пикселям.[12]

В 2007 году в Университете Аризоны было создано устройство, использующее адресацию молекул для кодирования сайтов несовпадения в цепи ДНК. Эти несоответствия затем можно было считать, выполнив дайджест ограничений, тем самым восстановив данные.[13]

В 2011 году Джордж Черч, Шри Косури и Юань Гао провели эксперимент, который закодировал книгу размером 659 килобайт, соавтором которой был Черч. Для этого исследовательская группа провела взаимно-однозначное соответствие, в котором двоичный ноль был представлен либо аденином, либо цитозином, а двоичный ноль - гуанином или тимином. После обследования в ДНК было обнаружено 22 ошибки.[12]

В 2012, Георгия и коллеги в Гарвардский университет опубликовал статью, в которой ДНК была закодирована с помощью цифровой информации, которая включала HTML-черновик книги из 53 400 слов, написанной ведущим исследователем, одиннадцать изображений в формате JPG и одну программу на JavaScript. Добавлено несколько копий для избыточности и 5.5. петабиты может храниться в каждом кубическом миллиметре ДНК.[14] Исследователи использовали простой код, в котором биты были сопоставлены один к одному с базами, недостатком которого было то, что он приводил к длительным прогонам одной и той же базы, последовательность которых подвержена ошибкам. Этот результат показал, что, помимо других функций, ДНК также может быть другим типом носителя информации, таким как жесткие диски и магнитные ленты.[15]

В 2013 г. вышла статья исследователей из Европейский институт биоинформатики (EBI) и подан примерно в то же время, что и документ Церковь и его коллеги подробно рассказали о хранении, извлечении и воспроизведении более пяти миллионов бит данных. Все файлы ДНК воспроизводили информацию с точностью от 99,99% до 100%.[16] Основными нововведениями в этом исследовании стали использование схемы кодирования с исправлением ошибок для обеспечения чрезвычайно низкой скорости потери данных, а также идея кодирования данных в виде серии перекрывающихся коротких олигонуклеотиды можно идентифицировать с помощью схемы индексации на основе последовательностей.[15] Кроме того, последовательности отдельных цепей ДНК перекрывались таким образом, что каждая область данных повторялась четыре раза, чтобы избежать ошибок. Две из этих четырех цепей были построены в обратном направлении, также с целью устранения ошибок.[16] Стоимость одного мегабайта оценивалась в 12 400 долларов на кодирование данных и 220 долларов на поиск. Однако было отмечено, что экспоненциальное снижение затрат на синтез и секвенирование ДНК, если оно продолжится в будущем, должно сделать эту технологию рентабельной для долгосрочного хранения данных к 2023 году.[15]

В 2013 году Маниш К. Гупта и его сотрудники разработали программное обеспечение под названием DNACloud для кодирования компьютерных файлов в соответствии с их ДНК. Он реализует версию алгоритма эффективности использования памяти, предложенного Goldman et al. для кодирования (и декодирования) данных в ДНК (файлы .dnac).[17][18]

О долгосрочной стабильности данных, закодированных в ДНК, сообщалось в феврале 2015 года в статье исследователей из ETH Цюрих. Команда добавила избыточность через Исправление ошибок Рида – Соломона кодирования и инкапсуляции ДНК в сферы из кварцевого стекла с помощью Золь-гель химия.[19]

В 2016 г. исследование Черч и Исследования и инновации Technicolor был опубликован, в котором было сохранено и восстановлено из ДНК 22 МБ сжатой последовательности фильма MPEG. Было обнаружено, что восстановление последовательности не имеет ошибок.[20]

В марте 2017 г. Янив Эрлих и Дина Зелински из Колумбийский университет и Нью-Йоркский центр генома опубликовал метод, известный как Фонтан ДНК, который хранит данные с плотностью 215 петабайт на грамм ДНК. Техника приближается к Емкость Шеннона хранилища ДНК, достигнув 85% от теоретического предела. Метод не был готов для широкомасштабного использования, так как синтез 2 мегабайт данных стоит 7000 долларов, а чтение - еще 2000 долларов.[21][22][23]

В марте 2018 г. Вашингтонский университет и Microsoft опубликовал результаты, демонстрирующие хранение и извлечение примерно 200 МБ данных. В исследовании также был предложен и оценен метод произвольный доступ элементов данных, хранящихся в ДНК.[24][25] В марте 2019 года та же команда объявила, что продемонстрировала полностью автоматизированную систему для кодирования и декодирования данных в ДНК.[26]

Исследование опубликовано Eurecom и Имперский колледж в январе 2019 продемонстрировал возможность хранить структурированные данные в синтетической ДНК. Исследование показало, как кодировать структурированные или, точнее, реляционные данные в синтетической ДНК, а также продемонстрировало, как выполнять операции обработки данных (аналогичные SQL ) непосредственно на ДНК как химические процессы.[27][28]

В июне 2019 года ученые сообщили, что все 16 ГБ Википедия были закодированы в синтетическая ДНК.[4]

Первая статья, описывающая хранение данных о последовательностях нативной ДНК посредством ферментативного разрезания, была опубликована в апреле 2020 года. В этой статье ученые демонстрируют новый метод записи информации в основу ДНК, который обеспечивает побитовый произвольный доступ и вычисления в памяти.[29]

Давосский биткойн-вызов

21 января 2015 г. Ник Гольдман от Европейский институт биоинформатики (EBI), один из первых авторов 2013 г. Природа бумага,[16] объявил Davos Bitcoin Challenge на Всемирный Экономический Форум ежегодное собрание в Давосе.[30][31] Во время его презентации аудитории были розданы ДНК-пробирки с сообщением, что каждая пробирка содержит закрытый ключ ровно одного биткойн, все закодировано в ДНК. Первый, кто последовательность и расшифровать ДНК может потребовать биткойн и выиграть испытание. Задача была поставлена ​​на три года и будет закрыта, если никто не получит приз до 21 января 2018 года.[31]

Почти три года спустя, 19 января 2018 г., EBI объявил, что бельгийский аспирант Сандер Вуйтс из Университет Антверпена и Vrije Universiteit Brussel, был первым, кто выполнил задание.[32][33] Рядом с инструкциями о том, как потребовать биткойны (хранятся в виде простого текста и PDF файл ), логотип EBI, логотип компании, напечатавшей ДНК (CustomArray), и эскиз Джеймс Джойс были извлечены из ДНК.[34]

ДНК вещей

Концепция ДНК вещей (DoT) была представлена ​​в 2019 году группой исследователей из Израиля и Швейцарии, в том числе Янив Эрлих и Роберт Грасс.[35][36][37] DoT кодирует цифровые данные в молекулы ДНК, которые затем встраиваются в объекты. Это дает возможность создавать объекты, несущие собственный план, похожие на биологические организмы. В отличие от Интернет вещей, который представляет собой систему взаимосвязанных вычислительных устройств, DoT создает объекты, которые являются независимыми объектами хранения, полностью от сетки.

В качестве доказательства концепции DoT исследователь напечатал на 3D-принтере Стэнфордский кролик который содержит свой чертеж в пластиковой нити, используемой для печати. Отрезав крошечный кусочек уха кролика, они смогли прочитать план, размножить его и произвести следующее поколение кроликов. Кроме того, способность DoT служить для стеганографический целей было продемонстрировано путем производства неразличимых линз, которые содержат YouTube видео интегрировано в материал.

Смотрите также

Рекомендации

  1. ^ а б c d е Сезе Л., Нивала Дж., Штраус К. (август 2019 г.). «Молекулярное хранение цифровых данных с использованием ДНК». Обзоры природы. Генетика. 20 (8): 456–466. Дои:10.1038 / с41576-019-0125-3. PMID  31068682.
  2. ^ Акрам Ф., Хак И.Ю., Али Х., Лагари А.Т. (октябрь 2018 г.). «Тенденции хранения цифровых данных в ДНК: обзор». Отчеты по молекулярной биологии. 45 (5): 1479–1490. Дои:10.1007 / s11033-018-4280-у. PMID  30073589.
  3. ^ Panda D, Molla KA, Baig MJ, Swain A, Behera D, Dash M (май 2018 г.). «ДНК как устройство для хранения цифровой информации: надежда или шумиха?». 3 Биотехнологии. 8 (5): 239. Дои:10.1007 / s13205-018-1246-7. ЧВК  5935598. PMID  29744271.
  4. ^ а б Shankland S (29 июня 2019 г.). «Стартап упаковывает все 16 ГБ Википедии в цепочки ДНК, чтобы продемонстрировать новую технологию хранения - биологические молекулы прослужат намного дольше, чем новейшие компьютерные технологии хранения, - считает Каталог».. CNET. Получено 7 августа 2019.
  5. ^ Димер Д., Акесон М., Брэнтон Д. (май 2016 г.). «Три десятилетия секвенирования нанопор». Природа Биотехнологии. 34 (5): 518–24. Дои:10.1038 / nbt.3423. ЧВК  6733523. PMID  27153285.
  6. ^ Фейнман Р.П. (29 декабря 1959 г.). "Внизу много места". Ежегодное собрание Американского физического общества. Калифорнийский технологический институт.
  7. ^ "Михаил Самойлович Нейман (1905-1975)".
  8. ^ Нейман М.С. (1964). «Некоторые фундаментальные вопросы микроминиатюризации» (PDF). Радиотехника (1): 3–12.
  9. ^ Нейман М.С. (1965). «О взаимосвязи между надежностью, производительностью и степенью микроминиатюризации на молекулярно-атомном уровне» (PDF). Радиотехника (1): 1–9.
  10. ^ Нейман М.С. (1965). «О системах молекулярной памяти и направленных мутациях» (PDF). Радиотехника (6): 1–8.
  11. ^ Винер Н (1964). «Интервью: машины умнее людей?». Новости США и мировой отчет. 56: 84–86.
  12. ^ а б Extance A (сентябрь 2016 г.). «Как ДНК может хранить все данные мира». Природа. 537 (7618): 22–4. Bibcode:2016Натура.537 ... 22E. Дои:10.1038 / 537022a. PMID  27582204.
  13. ^ Скиннер GM, Visscher K, Mansuripur M (2007-06-01). «Биосовместимая запись данных в ДНК». Журнал бионанологии. 1 (1): 17–21. arXiv:1708.08027. Дои:10.1166 / jbns.2007.005.
  14. ^ Церковь GM, Гао Ю., Косури С. (сентябрь 2012 г.). «Хранение цифровой информации нового поколения в ДНК». Наука. 337 (6102): 1628. Bibcode:2012Sci ... 337.1628C. Дои:10.1126 / science.1226355. PMID  22903519. S2CID  934617.
  15. ^ а б c Юн Э (2013). «Синтетическая двойная спираль точно хранит сонеты Шекспира». Природа. Дои:10.1038 / природа.2013.12279.
  16. ^ а б c Гольдман Н., Бертоне П., Чен С., Дессимоз С., Лепруст Э.М., Сипос Б., Бирни Э (Февраль 2013). «На пути к практичному, емкому, не требующему обслуживания хранилищу информации в синтезированной ДНК». Природа. 494 (7435): 77–80. Bibcode:2013Натура 494 ... 77Г. Дои:10.1038 / природа11875. ЧВК  3672958. PMID  23354052.
  17. ^ Шах С., Лимбахия Д., Гупта МК (2013-10-25). «DNACloud: потенциальный инструмент для хранения больших данных на ДНК». arXiv:1310.6992 [cs.ET ].
  18. ^ Лимбачия Д., Дхамелия В., Хахар М., Гупта М.К. (25 апреля 2016 г.). Об оптимальном семействе кодов для архивного хранения ДНК. 2015 Седьмой международный семинар по проектированию сигналов и их применению в коммуникациях (IWSDA). С. 123–127. arXiv:1501.07133. Дои:10.1109 / IWSDA.2015.7458386. ISBN  978-1-4673-8308-0.
  19. ^ Грасс Р.Н., Хекель Р., Пудду М., Паунеску Д., Старк В.Дж. (февраль 2015 г.). «Надежное химическое сохранение цифровой информации о ДНК в диоксиде кремния с кодами, исправляющими ошибки». Angewandte Chemie. 54 (8): 2552–5. Дои:10.1002 / anie.201411378. PMID  25650567.
  20. ^ Blawat M, Gaedke K, Huetter I, Chen XM, Turczyk B, Inverso S, Pruitt BW, Church GM (2016). «Прямая коррекция ошибок для хранения данных ДНК». Процедуры информатики. 80: 1011–1022. Дои:10.1016 / j.procs.2016.05.398.
  21. ^ Юн Э. «Эта частичка ДНК содержит фильм, компьютерный вирус и подарочную карту Amazon». Атлантический океан. Получено 3 марта 2017.
  22. ^ «ДНК может хранить все данные мира в одной комнате». Научный журнал. 2 марта 2017 г.. Получено 3 марта 2017.
  23. ^ Эрлих Y, Зелински Д. (март 2017 г.). «Фонтан ДНК обеспечивает надежную и эффективную архитектуру хранения». Наука. 355 (6328): 950–954. Bibcode:2017Научный ... 355..950E. Дои:10.1126 / science.aaj2038. PMID  28254941.
  24. ^ Organick L, Ang SD, Chen YJ, Lopez R, Yekhanin S, Makarychev K, et al. (Март 2018 г.). «Произвольный доступ в крупномасштабном хранилище данных ДНК». Природа Биотехнологии. 36 (3): 242–248. Дои:10.1038 / nbt.4079. PMID  29457795.
  25. ^ Патель П (20 февраля 2018 г.). "Хранилище данных ДНК получает произвольный доступ". IEEE Spectrum: Новости технологий, инженерии и науки. Получено 2018-09-08.
  26. ^ «Microsoft, UW демонстрирует первое полностью автоматизированное хранилище данных ДНК». Истории инноваций. 2019-03-21. Получено 2019-03-21.
  27. ^ Аппусвами Р., Ле Бриганд К., Барбри П., Антонини М., Мэддерсон О., Фримонт П., Макдональд Дж., Хайнис Т. (2019). «OligoArchive: Использование ДНК в иерархии хранилищ СУБД» (PDF). Конференция по исследованиям инновационных систем данных (CIDR).
  28. ^ «Сайт OligoArchive». oligoarchive.github.io. Получено 2019-02-06.
  29. ^ Табатабаи, С. Касра; Ванга, Бойя; Атрейя, Нагендра Бала Мурали; Энгиад, Бехнам; Эрнандес, Альваро Гонсало; Филдс, Кристофер Дж .; Лебертон, Жан-Пьер; Соловейчик, Давид; Чжао, Хуйминь; Миленкович, Ольгица (8 апреля 2020 г.). «Перфокарты ДНК для хранения данных о последовательностях нативной ДНК с помощью ферментативного надрезания». Nature Communications. 11 (1): 1–10. Дои:10.1038 / s41467-020-15588-z. ЧВК  7142088. PMID  32269230.
  30. ^ Всемирный экономический форум (2015-03-10), Компьютеры будущего: жесткие диски ДНК | Ник Гольдман, получено 2018-05-19
  31. ^ а б "Хранение ДНК | Европейский институт биоинформатики". www.ebi.ac.uk. Получено 2018-05-19.
  32. ^ «Бельгийский аспирант расшифровывает ДНК и получает биткойн | Европейский институт биоинформатики». www.ebi.ac.uk. Получено 2018-05-19.
  33. ^ «Часть ДНК содержала ключ к 1 биткойну, и этот парень взломал код». Материнская плата. 2018-01-24. Получено 2018-05-19.
  34. ^ «От ДНК к биткойнам: как я выиграл биткойн-вызов в Давосе по хранению ДНК». Сандер Вуйтс. 2018-01-16. Получено 2018-05-19.
  35. ^ Кох, Джулиан (2019). «Архитектура хранения ДНК вещей для создания материалов со встроенной памятью». Природа Биотехнологии. 38 (1): 39–43. Дои:10.1038 / s41587-019-0356-z. PMID  31819259.
  36. ^ Молтени М (2019-12-09). «У этих пластиковых кроликов есть обновление ДНК. Далее, мир?». Проводной. Получено 2019-12-09.
  37. ^ Хотц Р.Л. (09.12.2019). «Ученые хранят данные в синтетической ДНК, встроенной в пластмассового кролика». Wall Street Journal. Получено 2019-12-09.

дальнейшее чтение