Пояснение | Развиваемая компанией Microsoft свободная NER-система (Named Entity Recognition), развиваемая для предотвращения утечек информации (Data Leak Prevention). Позволяет выявлять или удалять в документах, тексте и изображениях информацию, содержащую персональные и конфиденциальные данные, такие как ФИО, номера телефонов, email, номера кредитных карт, криптокошельки, адреса, номера паспортов, финансовые данные и т.п. Поддерживается обработка различных хранилищ (от Amazon S3 до PostgreSQL) и форматов. Код написан на языке Go (есть вариант на Python) и распространяется под лицензией MIT.
|