ДНК замість жорсткого диска — як молекула зберігає дані

У 1953 році Джеймс Вотсон і Френсіс Крік відкрили структуру ДНК. Сьогодні її розглядають як носій даних майбутнього, адже один грам ДНК здатний зберігати 215 петабайтів даних і залишатися стабільним тисячі років. Чи може ДНК замінити жорсткі диски, змінити підхід до архівування та як саме це працює — розглядаємо у статті від команди датацентра GigaCenter.

Що таке ДНК

Дезоксирибонуклеїнова кислота (ДНК) — це молекула, яка містить генетичну інформацію всіх живих організмів. Не дарма її називають головним спадковим матеріалом світу.

Кожна клітина людського тіла має однакову ДНК та складається з чотирьох нуклеотидів: аденіну (A), тиміну (T), цитозину (C) та гуаніну (G).

Як ДНК використовується для зберігання даних

Генетичний матеріал ДНК вчені розглядають як носій для зберігання цифрової інформації вже давно. Адже його щільність і довговічність вища за існуючі носії. Наприклад, ДНК в 1000 разів щільніша за найкомпактніший твердотільний жорсткий диск і в 300 разів міцніша за найстабільніші магнітні стрічки.

Крім того, чотирьохлітеровий нуклеотидний код ДНК: A, T, C та G — ідеальне середовище для кодування, яке можна використовувати, як двійковий цифровий код. Послідовність цих нуклеотидів кодує інформацію, подібно до того, як бінарний код: 0 та 1 використовується для зберігання даних у комп'ютерах.

Наприклад, бітові значення 0 та 1 можна зіставити з парами нуклеотидів: A-T та C-G. Після кодування інформації синтезується відповідна ДНК-послідовність, яка фізично зберігає дані. Для зчитування інформації використовується секвенування (метод визначення первинної структури) ДНК, яке відновлює початкові цифрові дані.

Переваги ДНК-зберігання над традиційними методами

ДНК навіть має свої переваги в зберігання даних. Наприклад у порівнянні з традиційним жорстким диском:

Щільність зберігання: ДНК може зберігати величезні обсяги даних у надзвичайно малому обсязі. За оцінками, один грам ДНК може вмістити до 215 петабайтів (215 мільйонів гігабайтів) інформації.

Довговічність: ДНК є стабільною молекулою, яка може зберігати інформацію тисячі років за належних умов, тоді як жорсткі диски та магнітні стрічки мають обмежений термін служби.

Енергоефективність: зберігання ДНК не потребує постійного живлення або охолодження, що знижує енергоспоживання та експлуатаційні витрати.

Перспективи та проблеми впровадження ДНК для зберігання даних

Хоча технологія досі активно досліджується, вона має значний потенціал для комерційного використання. Технологія може стати альтернативою традиційним методам зберігання, особливо для архівування великих обсягів даних, які потребують довготривалого зберігання.

Наприклад, дослідники з пекінського університету в Китаї розробили методи ензиматичного синтезу ДНК, що дозволяють швидше та дешевше записувати інформацію у ДНК порівняно з традиційними хімічними методами.

Дослідники закодували дані в ДНК, перетворюючи її на двійковий код із нулів і одиниць. Вони використали довгі ланцюги ДНК як основу та додавали до них коротші фрагменти, ніби нанизуючи намистини на нитку. Потім спеціальна хімічна реакція додавала метильну групу: метильовані ділянки означали "1", а неметильовані – "0".

Завдяки цьому методу вони змогли записувати інформацію одночасно в сотні місць, додаючи унікальні штрих-коди до кожного шаблону. Це дозволило зберігати 350 бітів у ДНК за один раз — у сотні разів більше, ніж раніше.

Під час тестів вони зберегли зображення у формі тигра часів стародавнього Китаю, а потім відновили його за допомогою секвенатора ДНК за допомогою алгоритму виправлення помилок. Отримані зображення відтворили з точністю 97 %.


Потертості гравюри тигра (ліворуч) були закодовані в ДНК, а потім отримані як зображення праворуч

А нещодавнє дослідження на основі штучного інтелекту дозволило зчитувати дані, що зберігаються в ланцюгах ДНК, протягом 10 хвилин. Все це наближає зберігання ДНК до практичного використання в обчислювальній техніці.

Але головна проблема впровадження ДНК для зберігання даних — вартість. Це дуже дорого, і масові впровадження цієї технології можливі лише після зниження вартості синтезу та секвенування.

ДНК для зберігання даних — реальні кейси

Стартап CATALOG ще у 2019 році створив платформу для зберігання даних на основі ДНК. Принцип зберігання той самий, що ми описували раніше. Завдяки співпраці з постачальником даних Seagate Technology вони значно розширили свою автоматизовану платформу зберігання та обчислення ДНК останніми роками.

Наприкінці 2022 року американському стартапу Catalog Technologies вдалося записати уривок у 17 000 слів із «Гамлета» Шекспіра на штучну ДНК-молекулу. Після цього вчені здійснили пошук за ключовими словами, що зайняло у них лише кілька хвилин.

Звичайно, швидкість не виглядає вражаючою — той самий Google проаналізує та знайде гігабайти інформації з усього інтернету за секунду. Проте це великий прорив у розвитку даної технології.

А вже в січні 2025 року Catalog представила першу комерційну книгу, закодовану в ДНК за допомогою цієї технології.

Книга Каталог ДНК Азімова

Друкована книга містить капсулу ДНК, надану Catalog, і продається за 60 доларів США в комплекті. Книга містить дев’ять нарисів і три науково-фантастичні твори.

Фахівці Catalog створили близько 500 000 унікальних молекул ДНК для кодування 240 сторінок книги, що представляють 481 280 байтів даних. Після перетворення на синтетичну ДНК її зберігали у вигляді сухого порошку в інертному газі для видалення вологи та кисню в капсулі.

ДНК капсули каталогу

Проте до масового використання технології все ще далеко. Можливе воно лише за двох умов — якщо фахівці зменшать час записування та розшифрування, та звісно ж знизять вартість використання ДНК як сховища даних. 

351
Events
Community
Videos
About Us