Обновленное решение «Перфоманс Лаб» для обезличивания данных
Компания «Перфоманс Лаб» анонсировала крупное обновление решения для обезличивания данных DataSan. В новую версию интегрирована функция профилирования персональных данных (ПДн) на базе алгоритмов машинного обучения (ML). Это позволяет автоматизировать поиск и классификацию ПДн в больших массивах данных, снижая трудозатраты и повышая точность.
Решение DataSan предназначено для деперсонализации данных в тестовых и аналитических средах. Продукт позволяет создавать безопасные, обезличенные копии баз данных, сохраняя при этом их структуру, логику и связность. Решение исключает риски утечки чувствительной информации и помогает компаниям соблюдать требования Федерального закона № 152-ФЗ «О персональных данных» при разработке и тестировании.
В новой версии решения используется предобученная LLM-модель, которая анализирует наименования и содержимое колонок в базах данных, а также их корреляцию. Это позволяет с точностью до 95% обнаруживать и классифицировать различные типы ПДн. К ним относятся ФИО, адреса, номера телефонов, банковские карты, паспортные данные, а также биометрические и специальные категории данных, например национальная принадлежность или религиозные убеждения.
Ручной и полуавтоматический методы поиска ПДн в базах занимают много времени и ресурсов, при этом ручной поиск не отличается высокой точностью. Функция ИИ-профилирования в DataSan ускоряет процесс поиска данных до 10 раз по сравнению с полуавтоматическим режимом, что позволяет обрабатывать десятки терабайт информации, т. е. базы данных любого размера. При этом оператор проверяет только конечные результаты работы модели.
Одно из ключевых преимуществ решения – высокая производительность поиска ПДн, до 300 столбцов в час на одном ядре процессора. DataSan проводит глубокий анализ большого количества строк, сохраняя высокую точность выходных данных. Пользователи могут настраивать правила профилирования, включая и исключая необходимые атрибуты.
Как комментируют в компании, ручной поиск и классификация персональных данных составляют львиную долю всей задачи маскирования. С учетом растущих требований регуляторов, особенно в части защиты ПДн, бизнесу необходимо эффективное решение для выполнения ФЗ без потери качества. Функция ИИ-профилирования в DataSan не только ускоряет этот процесс, но и удешевляет деперсонализацию как ключевой процесс защиты данных.