Як відбувається зберігання цифрових даних у ДНК [ Редагувати ]

Джерело: Unsplash
ДНК називають "природним носієм інформації" – цей механізм протягом мільярдів років точно зберігає набори команд для всього живого на Землі. Але вона також може містити ключі до управління вибуховим зростанням даних та зберігання архівних даних для майбутніх поколінь.
Ідея зберігання цифрових даних у ДНК виникла понад півстоліття тому, але її втілення в життя почало прискорюватися лише останніми роками, завдяки досягненням біотехнологій та зниженню вартості секвенування геному.
Дейв Ландсман – старший директор з галузевих стандартів та інженер компанії Western Digital розповідає про те, як це стане реальним. Протягом останніх двох років він був одним із керівників дослідження компанії у галузі зберігання даних ДНК.
"У міру того, як ми шукаємо способи зберігання величезного обсягу даних, викликаного прагненням оцифрувати, зберегти і добути все більше інформації, нам необхідно вивчити нові технології зберігання даних, які доповнять сьогоднішню ієрархію. Хоча ця технологія тільки зароджується, використання ДНК може відкрити можливість зберігання величезних обсягів даних протягом десятиліть або століть за низькою ціною", — сказав Ландсман.
Наприкінці 2020 року технологічні лідери Twist Bioscience, Illumina, Microsoft та Western Digital об'єднали зусилля для створення Альянсу із зберігання даних ДНК. Організація зросла до більш ніж 60 компаній-членів і нещодавно приєдналася до Асоціації індустрії мереж зберігання даних (SNIA) як група SNIA Technology Affiliate. Це дозволяє використовувати членство в Альянсі та досвід SNIA у розробці стандартів.
Як об'єдналися вчені
Ландсман пояснив, як технологія зберігання даних ДНК спирається на будівельні блоки хімії та біології.
Молекули ДНК складаються з довгих ланцюжків нуклеотидів. Кожен нуклеотид ДНК містить основу (аденін, гуанін, цитозин або тимін), яку використовують наші клітинні механізми для кодування та вираження людського геному.
Завдяки значному прогресу, досягнутому за останні кілька десятиліть, тепер можна побудувати синтетичну молекулу ДНК, основу за основою, причому основи розташовуються в будь-якому порядку.
"Наука маніпулювання ДНК на молекулярному рівні, яка вже понад 30 років використовується в медицині та інших науках, просунулася настільки, що зберігання цифрових даних у ДНК вже не наукова фантастика, а реальність, що розвивається", — сказав Ландсман.
Технологія вже довела, що вона може працювати. Два роки тому компанія Twist Bioscience зберегла в ДНК перший епізод серіалу Biohackers від Netflix.
За словами Ландсмана, наразі завдання полягає в тому, щоб масштабувати науку. "Це те, в чому досягла успіху технологічна індустрія, і саме тут відбуватиметься диво в найближчі 5-10 років", – сказав він.
Чому саме зберігання даних у ДНК?
ДНК як носій інформації має багато характеристик, які роблять її привабливим варіантом для архівного зберігання даних в масштабі зеттабайта.
Щільність ДНК на порядки вища, ніж у будь-якого із сучасних носіїв інформації. Найбільш поширеним носієм, що використовується для архівування даних, є стрічкові касети LTO. Останнє покоління LTO-9 може зберігати 18 ТБ на картриджі. Якщо заповнити цей же картридж бітами ДНК, то на ньому зберігатиметься майже 2 екзабайти даних. Це більш ніж у 100 000 разів перевищує ємність однієї касети LTO-9.
Ландсман пояснив, що, крім того, що біти ДНК дуже малі, вони довго зберігаються, недорогі в зберіганні і не вимагають оновлення. За умови, що вони не піддаються впливу води та окислення, молекули ДНК можуть зберігатися тисячі років.
Довговічність ДНК також означає, що архіви на основі ДНК не потрібно з часом переписувати на нові носії. Крім того, ДНК має незмінний формат. Читання архіву в майбутньому не буде обмежене наявністю оригінальних пристроїв для читання.
Завдяки всім цим факторам ДНК, як носій інформації, має значні переваги з погляду сукупної вартості та екології. Замість того щоб будувати все нові і нові 100-мегаватні центри обробки даних, що розростаються, дані можна зберігати практично без енергії в крихітній компактній капсулі. Це дозволить створити нові способи зберігання та отримання вигоди з океану інформації, яку ми сьогодні переводимо в цифровий формат.
"Якщо резервне копіювання стане доступним, ми, у глобальному сенсі, резервуватимемо все", – говорить Штеффен Хеллмолд, віце-президент з розвитку бізнесу в галузі зберігання даних у компанії Twist Bioscience, що спеціалізується на створенні інструментів синтетичної ДНК.
Кому і як це потрібно
Згідно з нещодавніми дослідженнями аналітиків, щонайменше 30% цифрового бізнесу вимагатимуть проведення випробувань сховищ даних у ДНК до 2024 року.
Початкові ринки для зберігання даних у ДНК включають медіа та розваги, наукові дослідження, Big Data та Tech, охорону здоров'я. Всі ці напрямки мають вимоги до довгострокового архівування.
Але на відміну від інших науково-фантастичних концепцій носіїв інформації, таких як скло або голограма, зберігання даних у ДНК має ще одну важливу задачу: просвітництво ринку щодо концепцій біологічних обчислень.
"Хтось запитав мене, лише частково жартома: "Чи означає зберігання даних у ДНК, що я завантажуватиму свою музичну колекцію у свого собаку?". Я пояснив, що для створення носія даних ДНК ні в якому разі не створюється жодних клітин, організмів чи інших форм життя. Ми просто використовуємо хімічні механізми для зберігання цифрових бітів у молекулах ДНК, замість використання електромагнітних або оптичних механізмів для зберігання бітів у кремнії, магнітних або інших матеріалах", — коментує Ландсман.