Разработана первая аппаратная система сортировки в памяти
В Nature Electronics опубликовано исследование под названием «Быстрая и реконфигурируемая система сортировки в памяти на основе мемристоров», в котором предлагается архитектура без компараторов, позволяющая решить одну из самых сложных задач в области технологии обработки в памяти (PIM).
Сортировка — это фундаментальная вычислительная задача, но из-за её нелинейной природы её сложно ускорить с помощью традиционного оборудования. Хотя архитектуры PIM на основе мемристоров показали себя с лучшей стороны в плане линейных операций, они долгое время не справлялись с сортировкой. Команда профессора Янга решила эту проблему, устранив необходимость в компараторах и представив новый механизм считывания цифр, а также новый алгоритм и аппаратную конструкцию, которые позволяют по-новому взглянуть на то, как можно выполнять сортировку в памяти.
Эта работа представляет собой значительный шаг вперёд в развитии технологии PIM: от линейных матричных операций к нелинейным задачам высокой сложности, таким как сортировка. Предложив масштабируемую и реконфигурируемую систему сортировки, команда создала высокопроизводительное энергоэффективное решение, отвечающее требованиям к производительности современных приложений для работы с большими данными и искусственным интеллектом.
В исследовании представлена система сортировки без компаратора, построенная на массиве мемристоров «один транзистор — один резистор» (1T1R) с использованием механизма считывания цифр, который заменяет традиционную логику сравнения и выбора и значительно повышает эффективность вычислений. Команда также разработала алгоритм пропуска древовидных узлов (Tree Node Skipping, TNS), который ускоряет сортировку за счёт повторного использования путей обхода и сокращения количества ненужных операций.
Для масштабирования производительности при работе с различными наборами данных и конфигурациями были представлены три стратегии Cross-Array TNS (CA-TNS). Стратегия Multi-Bank разбивает большие наборы данных на массивы для параллельной обработки; Bit-Slice распределяет ширину битов для обеспечения конвейерной сортировки; а Multi-Level использует состояния с несколькими проводимостями мемристоров для повышения внутриячеечного параллелизма.
В совокупности эти инновации представляют собой гибкий и адаптируемый ускоритель сортировки, способный обрабатывать данные различной ширины и сложности.
Чтобы проверить производительность в реальных условиях, команда изготовила мемристорный чип и интегрировала его с ПЛИС и печатными платами, чтобы создать полноценную сквозную демонстрационную систему. В ходе контрольных тестов она показала в 7,70 раза большую скорость, в 160,4 раза более высокую энергоэффективность и в 32,46 раза большую эффективность по площади по сравнению с ведущими системами сортировки на базе ASIC.
Система также доказала свою эффективность в практических приложениях: при планировании маршрута по алгоритму Дейкстры она успешно вычислила кратчайшие пути между 16 станциями пекинского метро с низкой задержкой и энергопотреблением. При выводе данных из нейронной сети она обеспечила настраиваемую разреженность во время выполнения за счёт интеграции TNS с матрично-векторным умножением на основе мемристоров в модели PointNet++, что позволило повысить скорость в 15 раз и энергоэффективность в 67,1 раза. Эти результаты свидетельствуют о широкой применимости системы как в обычных, так и в интеллектуальных рабочих нагрузках.\
Сообщение Разработана первая аппаратная система сортировки в памяти появились сначала на Время электроники.