Многослойные и многоуровневые ячейки NAND — поистине шедевр полупроводниковых технологий. Однако с дальнейшей их миниатюризацией от достигнутого к настоящему времени уровня дела обстоят совсем не просто: по фундаментальным физическим причинам даже сокращение габаритов наноконденсаторов, что служат там базовыми элементами хранения данных, представляет собой неимоверно сложную задачу. Увеличивать количество хранимых в одной ячейке битов данных — переходить от наиболее распространённых сегодня трёх- и четырёхбитовых микросхем памяти (TLC и QLC) к пятибитовым (PLC) и более — тоже стратегически тупиковый вариант: вероятность ошибок при операциях с такими ячейками заметно возрастает, да и долговечность их (количество циклов перезаписи, после которого наноконденсатор банально выходит из строя) драматически снижается.
Достаточно сказать, что заказчики SSD для облачных ИИ-серверов — а именно этот сравнительно узкий сегмент мирового рынка накопителей показывает в последнее время выдающийся рост, исчисляемый десятками процентов квартал к кварталу, — предпочитают, по данным экспертов TrendForce, не пяти-, не четырёх-, а как раз как раз трёхуровневые (TLC) устройства ёмкостью 4-8 Тбайт, поскольку именно те на сегодня демонстрируют оптимальное соотношение трёх важнейших для бизнеса параметров. А именно — высокой ёмкости; достаточной для ИИ-задач производительности под высокой нагрузкой; а заодно и долговечности, позволяющей заведомо окупить их установку в коммерческие системы. Иными словами, развитие NAND-технологий с точки зрения гиперскейлеров, что предоставляют облачный доступ к моделям ИИ entrprise-уровня, уже по сути упёрлось в «стеклянный потолок» оправданности инвестиций, — самое время подыскивать им на смену что-нибудь новенькое. Что-нибудь с таким же значительным потенциалом развития, каким обладала та же самая полупроводниковая память десяток-другой лет назад.
Предполагается, что к 2029 г. микросхемы 3D NAND смогут обеспечить плотность записи данных до 70 Гбит/мм². Это само по себе очень внушительное значение — даже если оставить в стороне вопрос о том, с какими задержками столкнутся компьютерные системы недалёкого будущего, обращаясь к столь насыщенным информацией полупроводниковым структурам. А обращаться придётся — особенно в ходе тренировки новых; куда более изощрённых, чем доступные сегодня, моделей искусственного интеллекта. Динамика роста их аппетитов впечатляет: для тренировки GPT-3, к примеру, использовался набор данных в 570 Гбайт (указан объём сжатого текста — только текста, без изображений и видео, поскольку это не мультимодальная модель — да ещё после фильтрации исходного, куда более крупного массива), породивший 400 млрд токенов. Согласно экспертным оценкам, для тренировки грядущей (предположительно, её представят публике в ноябре-декабре 2024-го, после американских выборов) GPT-5 использовано уже более 280 Тбайт отфильтрованных данных, превращённых в свыше 70 трлн токенов. Увеличение объёма потребной для обучения модели информации почти на три десятичных порядка всего примерно за пару лет огорошивает, — и если подобные темпы хотя бы частично сохранятся, а на смену нынешнему генеративному ИИ не придёт какого-то менее прожорливого в ресурсном плане способа организации машинного обучения для решения тех же задач, ёмких накопителей мировой ИТ-отрасли потребуется по-настоящему много. Возможно, немалая их доля окажется в относительно скором времени как раз жидкостными (liquid-based), — причём внутри этого только-только начавшего развиваться направления уже успели оформиться несколько конкурирующих технологий.
⇡#Наноразмер имеет значение
В 2022 г. исследователи из бельгийского IMEC (Interuniversity Microelectronics Centre) предложили сразу два подхода к организации жидкостной постоянной памяти: коллоидальный и электролитический, — каждый из которых в перспективе открывает возможность для создания накопителей с плотностью записи данных до 1 Тбит/мм². Учитывая, насколько снизились темпы роста плотности у появляющихся в последние годы всё более «многоэтажных» NAND-чипов, развитие liquid-based storage (LBS) представляется более чем привлекательным — даже с учётом необходимых для этого немалых инвестиций. По мнению авторов этой идеи, жидкостная память может начать появляться в виде серийных хранилищ данных уже с начала 2030-х гг., а по скорости доступа она к тому времени сможет занять промежуточное положение между HDD и ленточными кассетами. 3D NAND и через 5-6 лет продолжит оставаться непревзойдённой в плане оперативности отклика, однако в таких задачах, как создание резервных копий с возможностью достаточно быстрого поиска и извлечения данных, а также хранение — не архивное, а, что называется, под рукой; nearline — мультимедийных коллекций и иных объёмистых файлов LBS имеет все шансы потеснить привычные сегодня жёсткие диски. Особенно с учётом того, что и те выходят, похоже, на плато роста плотности сохраняемой на магнитных пластинах информации.
Напомним, по какой именно причине полупроводниковую память, будь то DRAM или NAND, чрезвычайно трудно миниатюризировать сверх определённого масштаба. Каждая ячейка такого хранилища данных, одно- или многоуровневая, состоит из по меньшей мере одного собственно запоминающего — хранящего электрический заряд — элемента, а также из устройства доступа к этому элементу; условного коммутатора, в роли которого выступает диод или транзистор. Через коммутатор запоминающий элемент подключается к электрическим шинам, по которым поступают команды на чтение/запись/обнуление ячеек. Хотя запоминающий элемент теоретически можно миниатюризировать вплоть до молекулярных масштабов, особенно если перейти от конденсаторов к мономолекулярным магнитам, коммутаторы и шины данных в полупроводниковом приборе неизбежно продолжат оставаться сравнительно макроскопическими объектами — минимальный характерный размер которых определяется характеристиками технологического процесса, что используют для изготовления данного чипа.
В случае HDD и тем более ленточных кассет организация хранения данных принципиально иная: там устройство доступа либо одно, либо представлено ограниченным числом головок чтения/записи, каждая из которых обслуживает свою область носителя — магнитного диска или соответственно ленты. Носитель же чаще всего представляет собой неразмеченную (unpatterned) среду — хотя в последнее время, с развитием технологий HAMR/MAMR, а в перспективе и BPM, начинает заходить речь о точном нацеливании головок чуть ли не на отдельные магнитные домены на поверхности дисков. Использование неразмеченной среды удешевляет магнитные технологии хранения данных в сравнении с полупроводниковыми — но за счёт очевидного увеличения времени доступа к каждому отдельному биту, равно как и количества энергии, необходимого для каждого акта записи/считывания (как минимум по причине необходимости физически перемещать головки над средой хранения). Зато уменьшать геометрические размеры этих битов выходит куда эффективнее, чем в случае всё той же NAND.
⇡#Даёшь коллоид!
Предложенный исследователями из IMEC подход к хранению данных — в некотором смысле промежуточный между классическими полупроводниковым и магнитным. Здесь также имеется объёмная (как в 3D NAND, например) среда хранения — но устройства доступа к данным располагаются плотным плоским массивом, каждый элемент которого контролирует информацию в столбце вещества — «колодце» — непосредственно под ним (или же над ним; принципиальной разницы тут нет, поскольку в столь узких колодцах капиллярные явления более значимы, чем воздействие гравитации). Таким образом значительно — если сравнивать с полупроводниковой памятью — сокращается число коммутаторов, приходящихся на каждый бит хранимых данных; а значит, шире становятся возможности для миниатюризации такого накопителя в целом. Рассматривая «колодец данных» не абстрактно, а вполне буквально, нетрудно повторить мысленный путь инженеров IMEC к концепции коллоидной памяти — когда вертикальные выемки в физическом основании накопителя заполняются коллоидной системой, т. е. такой, в которой содержатся гетерогенно, не смешиваясь и не взаимопревращаясь, как минимум две фазы в различных агрегатных состояниях. Чаще всего это жидкая среда (в данном случае — дистиллированная вода) и твёрдый наполнитель. Последний представлен наночастицами двух типов, одни из которых кодируют единицы, другие — нули, а физические размеры их таковы, что в ствол колодца данных они помещаются свободно, без усилий, но — строго поодиночке.
Таким образом, записанная в базовую ячейку последовательность символов, условное машинное слово, будет представлять собой просто последовательность частиц с различными свойствами — главное, подобрать их так, чтобы с уверенностью различать «нули» и «единицы» при считывании информации и свободно манипулировать ими при записи. Для этих операций в IMEC предлагают использовать привычные полупроводниковые КМОП-структуры, а значит, отличаться один от другого типы частиц — носителей данных в коллоидной памяти — должны, к примеру, по величине электрического заряда. Со считыванием больших проблем не предвидится: «вытягивать» по одной заряженные наночастицы из определённого колодца-капилляра и фиксировать на выходе из его ствола, «ноль» сейчас вернулся в общий резервуар, или «единица», — дело нехитрое. Другой вопрос — запись данных: отловить в резервуаре частицу с нужной величиной заряда и поместить её в строго заданный колодец — определённо инженерная задача со звёздочкой.
Использовать электрически заряженные частицы в данном случае было бы опрометчиво: в общем резервуаре не удастся избежать паразитного притягивания/отталкивания между ними, что усложнит путь коллоидных «битов» к выборочному помещению в нужные капилляры. Исследователи сделали ставку на явление частотно-зависимого диэлектрофореза: благодаря ему удаётся сепарировать в жидкой среде под воздействием внешнего электрического поля частицы — сами по себе нейтральные, но по-разному реагирующие на различные электромагнитные частоты. Здесь, конечно, ещё немало не только практической, но и теоретической работы: скажем, потребуется разработать эффективный протокол записи — одновременно и достаточно скоростной, и гарантирующий от неприемлемого количества ошибок. Общий принцип уже понятен: допустим, при приложении внешнего поля с условной частотой «0» во все колодцы-капилляры накопителя будут поступать из резервуара частицы-«нули», и задачей КМОП-контроллера будет перекрыть горловины тех капилляров, в которые в данный момент очередной «ноль» записывать не надо. Так или иначе, на микронной размерной шкале в IMEC уже подтвердили работоспособность коллоидного накопителя экспериментально, — вопрос теперь лишь в изыскании средств и выделении инженерного ресурса на то, чтобы масштабировать его до нанометровых величин основных рабочих элементов.
⇡#И электролит не повредит
Другая разновидность жидкостного накопителя, предложенная бельгийскими исследователями, — электролитическая. Электролизом, напомним, называют процесс образования химических продуктов на электродах (которые находятся в контакте со средой с ионной проводимостью) при протекании электрического тока через образующийся при таком контакте замкнутый контур. В данном случае роль среды исполняет раствор — в воде или иной подходящей жидкости — ионов двух металлов, готовность каждого из которых осаждаться на электроде напрямую зависит от величины приложенного к цепи потенциала. Собственно накопитель тоже, как и в случае коллоидной памяти, представляет собой резервуар для жидкости с массивом капилляров, но только здесь на дне каждого колодца расположен индивидуальный управляющий электрод (контролируемый, опять-таки, КМОП-контуром), а с противоположной стороны резервуара — общий большой электрод, один на весь массив.
Принцип действия электролитического накопителя тоже довольно прозрачен: подавая на управляющий электрод в одном из капилляров определённый потенциал, система заставляет осаждаться на нём (т. е. в стволе соответствующего колодца) ионы либо одного, либо другого металла из состава раствора. Предложенный в IMEC способ кодирования данных состоит в использовании одного из металлов для записи информации (условно, слой толщиной в 1 нм будет означать «0», в 2 нм — «1»), а второго — для формирования промежуточных слоёв между укладываемыми последовательно в колодец «битами». Считывание же данных производится путём запуска электролиза в обратную сторону — с подсчётом изменения потенциала каждого капилляра по мере истекания (в буквальном смысле слова) из него записанной ранее информации. Здесь тоже придётся решать немало технических проблем, — например, взаимопроникновение двух металлов на границе раздела между ними может оказаться достаточно глубоким (речь, напомним, идёт о слоях в 1-2 нм толщиной), чтобы приводить затем к ошибкам считывания. И всё же в эксперименте IMEC удалось — используя пока, правда, миллиметровые и микрометровые по диаметру капилляров массивы — добиться уверенного электролитического депонирования, а потом контролируемого растворения (с фиксацией этого процесса на уровне управляющей электроники, — т. е. с исполнением операции считывания) двух слоёв ионов CoNi, перемежённых тремя слоями ионов Cu. При этом чем меньше было сечение колодца, тем выше оказывались скорости записи и чтения.
Бельгийские исследователи, полностью осознавая сложность стоящих перед разработчиками жидкостной памяти инженерных задач, тем не менее говорят о достижимости уже к началу 2030-х запредельной по нынешним меркам плотности записи информации в накопителях такого рода, — 1 Тбит/мм², причём оценивают себестоимость этих хранилищ данных в пересчёте на единицу занимаемой площади как более низкую, чем у наиболее передовых на тот момент микросхем 3D NAND. Технологического оптимизма этому прогнозу добавляет расчёт необходимой для достижения заявленных целей плотности размещения элементов жидкостного накопителя: всего-то 40 нм между соседними структурами — будь то нанокапилляры или управляющие металлические шины. Даже по нынешним микроэлектронным стандартам это действительно вполне щадящие спецификации, а уж в ожидаемых реалиях 2030 г. и подавно. Судя по всему, литографические методы станут основными про производстве жидкостной памяти, — поскольку что-то, а протравливать нанометровые в диаметре отверстия на точно намеченных позициях современное оборудование для изготовления полупроводников умеет отменно. Кстати, именно прогресс в области 3D NAND позволяет формировать на кремниевой подложке ровные вертикальные колодцы с соотношением высоты к диаметру 200:1 и даже 400:1, — как раз примерно такие будут требоваться для серийных образцов электролитической и коллоидной жидкостной памяти соответственно.
⇡#Т-1000 вызывали?
Памятный многим «робот из жидкого металла» (точнее, из металлического полисплава), с которым персонаж Арнольда Шварценеггера сражался во втором фильме франшизы «Терминатор», неизбежно приходит на ум в связи с довольно свежей (публикация датируется концом 2023 г.) разработкой учёных из пекинского университета Цинхуа, — FlexRAM. Как явствует уже из названия, это «гибкая» оперативная память — предназначенная в первую очередь для комплектования устройств с гибкими экранами. При этом в составе FlexRAM присутствует и вещество в жидкой фазе: это сплав на основе галлия (gallium-based liquid metal, GLM), температура плавления которого заметно ниже комнатной, как и у ртути, например, — и который по этой причине в нормальных условиях пребывает именно в жидком состоянии.
Поверхность капель жидкого металла — как, собственно, и частиц почти любого твёрдого — подвержена естественным процессам окисления и восстановления, в ходе которых атомы металла либо соединяются с кислородом (как правило, атмосферным: так образуются ржавчина, патина и проч.) либо, соответственно, теряют с ним связь. В случае FlexRAM эти процессы — управляемые: под воздействием невысокого контролирующего потенциала поверхности капель GLM, помещённых в гидрогель, окисляются; плёнка оксида препятствует прохождению электрического тока — тем самым сопротивление данного объёма в целом возрастает. Этому состоянию разработчики поставили в соответствие логическую единицу. Если тот же потенциал снова приложить к объёму, но уже с обратным знаком, произойдёт восстановление — и проводимость данного участка среды увеличится; таким образом кодируется логический ноль.
Пока что разработка китайских инженеров находится на самой ранней стадии: каждая GLM-капля кодирует один-единственный бит данных, а экспериментальная установка уверенно оперирует, записывая и считывая информацию, лишь с восемью каплями разом, — итого 1 байт. Есть, однако, крайне важное обстоятельство, заставляющее исследователей прочить FlexRAM солидные перспективы: эта память, формально по всем признакам оперативная, на деле способна сохранять записанные в неё данные довольно продолжительное время. В бескислородной среде поверхности GLM-капель остаются окисленными или же восстановленными в отсутствие внешних воздействий достаточно долго, — экспериментаторы заявляют о 12 часах. Устойчивость столь несложной физико-химической системы тоже довольно высока: подтверждено, что она выдерживает по меньшей мере 3,5 тыс. циклов перезаписи (изменения состояния поверхности с окисленной на восстановленную и обратно), что соответствует ресурсному запасу ячеек современных (многоуровневых) чипов NAND.
В качестве перспективных областей применения FlexRAM — разумеется, после того, как от нынешних миллиметровых масштабов удастся перейти к микро-, а лучше нанометровым — называют интерфейсы «мозг — машина», включая имплантируемые; гибкие или даже целиком жидкофазные вычислительные системы; мягкую робототехнику (soft robotics) и т. д. Говорят даже о схожести процессов окисления/восстановления на поверхности капель жидкого металла с гиперполяризацией/деполяризацией клеточной мембраны нейрона — подразумевая тем самым применимость жидкой памяти для создания близко имитирующих биологические объекты нейроморфных компьютеров.
Не стоит забывать и ещё об одном привлекающем в последнее время исследователей направлении, — ДНК-памяти и, шире, полноценных ДНК-вычислениях с реализацией на этих всем известных (хотя бы понаслышке) макромолекулах как хранения данных, так и логических операций над ними. ДНК-память хороша как раз для массивов информации, к которым необходим лишь отложенный доступ (nearline storage), а также для длительного архивного хранения: в идеальных условиях она, не саморазрушаясь и не требуя какого-либо обслуживания, остаётся неизменной десятилетиями. Даже о том, каким образом кодировать данные в ДНК, особо задумываться не приходится: эта молекула создана самой природой именно для записи (с последующим копированием) генетической информации в виде определённой последовательности нуклеотидов. И с плотностью размещения данных там полный порядок: всё содержимое библиотеки американского Конгресса (74 млн Мбайт по состоянию на 2021 г.) уместится в клубок ДНК-молекул размером с маковое зёрнышко.
Поскольку для ДНК наиболее подходит именно жидкая среда, вычислители (либо обособленные хранилища данных), созданные по этой технологии, безусловно также будут относиться к категории жидкостных. На этом направлении исследователей тоже ожидает немало вызовов — взять хотя бы крайне низкую скорость записи/чтения: скажем, американская программа MIST (Molecular Information Storage) ставит своей краткосрочной целью обеспечить считывание 10 Тбайт данных из экспериментального ДНК-хранилища за 24 часа, затратив на это не более 1 тыс. долл. США. Другой серьёзный вызов — не самая высокая надёжность хранения данных, особенно при репликации: склонности к изменчивости генетического кода встроена, можно сказать, на аппаратном уровне, — именно благодаря ей и идёт биологическая эволюция. В любом случае, жидкостная память и, шире, вычислительные системы на жидкостной основе выглядят весьма многообещающими в свете всё более тормозящихся темпов классического полупроводникового прогресса.
⇡#Материалы по теме
- Для хранения данных на ДНК предложены крошечные капсулы — это снизит уровень ошибок и защитит от потерь информации
- Шекспировского «Гамлета» закодировали в ДНК и показали быстрый поиск по ключевым словам
- IT-байки: Искусственная ДНК — кандидат на замену кремнию?