Category: технологии

Category was added automatically. Read all entries about "технологии".

white

DLP Как это работает? Часть 2. Веселые картинки

В прошлый раз мы обсудили, какие технологии в составе DLP-системы позволяют защищать информацию, представленную в виде простого текста. Сегодня мы расскажем о защите изображений. Традиционно для работы с отсканированными документами используют технологию преобразования картинок в текст (OCR), с которым DLP давно научились работать. Но что делать, если объект защиты – именно изображения?



Научить искусственный интеллект поиску по картинкам – дело хлопотное. Задача становится еще более сложной, если приходится искать не полное изображение, а его фрагменты. Поисковые системы не «заморачиваются» в этом отношении, а нам приходится.

Злоумышленник, задумавший украсть из родной организации чертежи или топографические карты, скорее всего, будет их пересылать по частям. Возможно, он перекодирует файл, сохранит изображение в другом формате, изменит его. Наша задача – сделать так, чтобы DLP точно и безошибочно «узнавала» исходный документ в потоке трафика и сообщить об утечке.

Самый простой способ – создать обучающую коллекцию изображений с положительными и отрицательными примерами. Данную технологию можно использовать для предотвращения утечек отсканированных личных документов, таких как паспорт или права.

Можно попросить систему реагировать на конкретные детали изображения. К примеру, эталонную печать. Такой печатью можно помечать документы, которые ни при каких условиях не должны передаваться вовне. Система будет искать не документы в целом, а элементы изображения печати, что немного проще.

Помимо этого, широко применяется копирайтный анализ (цифровые отпечатки) для картинок. В данном подходе используется заранее заданный образец картинки, и если перехваченный объект совпадает с эталоном, то утечка предотвращается. Про детектирование утечек сканов или фотографий кредитных карт мы не упоминаем. Это, как говорится, «семечки».

Главное, на анализ изображений в нашей DLP системе формат исходных файлов никак не влияет. Исходное изображение может быть изменено до неузнаваемости – отражение, поворот, наличие помех, шума, кроп, масштаб, разделение на фрагменты, - мы его все равно обнаружим.

Дальнейшим развитием в этом направлении может стать создание технологий анализа для ещё не затронутых форматов, которые в настоящее время могут быть проанализированы лишь как набор бит. Например, это могут быть технологии анализа видео. К сожалению, мощности современных процессоров не хватает для анализа видео в realtime режиме, но это вопрос 3-5 лет.

Ещё одним направлением развития технологий анализа является анализ внутренних взаимосвязей между данными внутри текста. Примерами таких технологий могут служить технология детектирования утечек выгрузок из баз данных и технология анализа заполненных форм.
white

DLP Как это работает? Защита текстовых файлов.

В этом блоге мы стараемся рассказывать не только о безопасности «вообще», но и о том, чем занимается InfoWatch. Как вы знаете, наша компания фокусируется на разработке программных продуктов для защиты информации от утечек - Data Leaks/Loss Prevention или DLP. Мы запланировали цикл небольших постов, чтобы познакомить вас с технологиями, которые лежат в основе наших продуктов. Попытаемся проследить их эволюцию, расскажем, как именно современные DLP-системы справляются со своей работой.

Начнём с азов. Когда DLP системы были совсем молодые, с помощью них удавалось предотвращать большинство утечек информации в текстовом виде. Сюда относится неизменяемая и динамически изменяемая информация, и информация, составленная по заданному шаблону. В детектировании таких данных нам помогали такие технологии как цифровые отпечатки, текстовый классификатор и текстовые объекты соответственно.

Если у нас есть документ, который никогда не изменяется – например, долгосрочная стратегия развития компании - с него целесообразно сделать цифровой отпечаток и в случае передачи его за периметр организации DLP-система зафиксирует утечку.

Есть документы, которые постоянно изменяются, но мы точно знаем, какая лексика там присутствует – все договоры, бухгалтерская документация. Такие документы лучше всего пропустить через систему текстовой классификации и выделить категории данных, за которыми будет следить DLP.

Защищать персональные данные и финансовую информацию лучше всего с помощью анализатора шаблонов. Технология поможет выявлять в потоке данных номера кредитных карт, номера паспортов, ИНН, СНИЛС и подобные идентификаторы. Хочется отметить, что только в решении InfoWatch реализована верифицирующая функция для текстовых объектов, позволяющая снизить число ложно положительных срабатываний системы.

Применяя этот небольшой набор технологий удавалось выявить конфиденциальные данные в текстовых документах (пакет MS Office, pdf, txt), в теле письма электронной почты, в сообщениях мессенджеров (ICQ, Skype и т.п), а также в сканах документов, из которых предварительно извлекался текст с помощь технологии OCR.






Основным недостатком данного подхода было ограничение перечня защищаемой информации. Так, невозможно было защитить, например, видеозапись либо фотографию секретного документа.

Дальнейшее развитие технологий перехвата и анализа привело к тому, что кроме текста стало возможным защищать от утечек информацию, представленную в двоичном виде, то есть любой файл. Но об этом в следующем блог-посте серии.

white

"Где родился, там и сгодился"

Так говорили в России во времена отсутствия общественного транспорта, присутствия крепостного права и необходимости получать выездную визу лично у царя.
       

С годами ситуация менялась слабо. И только возникновение массового общественного транспорта в 1920-х радикально расширило радиус трудоустройства гражданина – примерно с 1 километра до 10 (т.е. площадь – раз в сто). В некоторых странах это произошло раньше, чем в России/СССР, в некоторых позже, но везде рынок рабочей силы при таком качественном переходе радикально менялся. Обычно это приводило к технологическому скачку.

Экономисты утверждают, что сложность доступных предприятию технологий зависит от размера области поиска кадров. причём, эта зависимость сильнее, чем линейная. Если вдруг область вырастает в 100 раз – технологический рывок просто неизбежен.

В ближайшие годы рванёт ещё. Теперь – за счёт дистанционной работы, а также других дистанционных сервисов: обучения, продаж, удалённого присутствия. Средний радиус трудоустройства за несколько лет должен подскочить в десятки, если не сотни раз.

А перевод локальных работников на дистанционную работу обещает экономию на офисных площадях и транспорте. Впрочем, компьютеризация нам тоже много всякой экономии обещала. Говорила, продажная девка империализма, что один компьютер будет выполнять работу 10 человек. Обманула, стерва! Такую же самую работу сейчас делают 9 плюс сисадмин, эникейщик, администратор БД и ИТ-начальник. А за владение компьютером всем пришлось прибавить жалованья. Впрочем, прагматичные бизнесмены отказываться от автоматизации не спешат – свою выгоду они получили в другом месте.

Выгода от дистанционной революции тоже будет не в экономии. То, что хозяева сберегут на офисных площадях и транспорте, целиком пойдёт нам – производителям средств защиты от утечек. Наш сегмент рынка рискует треснуть от предстоящих доходов. Только не надо зацикливаться на традиционных DLP и защите периметра. Спрос уйдёт в сторону средств обеспечения удалённой работы.

white

Прячем листья в лесу

Всё прослушивается, всё просматривается, всё контролируется... Любой байт информации, прошедший через Гугл, Фейсбук, Айфон или международные платёжные системы, становится достоянием АНБ. Катастрофа? Нет, новые возможности для защиты!
       

Оно всё прослушивается и просматривается программами. Роботами. Примитивными алгоритмами, которым до высокого звания Искусственного интеллекта ещё пилить и пилить. Те объёмы данных, которыми оперируют скайпы и е-беи, настолько огромны, что человек не в состоянии просматривать даже одну стамиллионную долю. Там всё – строго автоматически.

Таким образом, возникает возможность сохранить конфиденциальность своих документов, в публичных сетях, облачных ресурсах и зарубежных каналах связи. Надо только не позволить вражеским алгоритмам анализа их найти и вычленить из океана Big Data.

Исключить и заменить ключевые слова. Вставить нейтрализующие слова. Назвать вещи не своими именами. Не ставить гриф или уведомление. И ещё десятка два способов, о которых хорошо ведомо SEOшникам. Их работа – поднять ресурс в поисковом рейтинге. Но легко справятся и с противоположной задачей – опустить. Все эти призмы с эшелонами устроены аналогично гуглам и яндексам. Как не существует отдельной военной и гражданской криптографии, так и алгоритмы поиска и категоризации – одинаковы для всех.

Поэтому DLP-система может на периметре ИС вместо принудительного шифрования принудительно редактировать документ, делая его непригодным для автоматического поиска и категоризации. В этой задаче кроме SEOшных и спамерские технологии пригодятся.

white

Человек обязан думать субъективно!

Тут раздался тихий, но масовый шелест в СМИ и соцсетях по поводу сервиса "Web of Trust (WOT)" – сервиса народной оценки веб-ресурсов. Точнее, по поводу использования результатов такой оценки при фильтрации почты и доступа к сайтам.
Скриншот

Идея сервиса проста и понятна: живые бесплатные люди видят всё лучше, чем неживые роботы. Их не обманешь всеми этими SEO-штучками. Они всё поймут и честно доложат о порнографии, мошенничестве, разглашении и вообще – о безопасности посещения ресурса. Отдельные ошибки и злопыхательства – усреднятся и не повлияют.

Ага, щазз!

Как раз наличие у юзеров разума и не позволяет достичь объективной оценки сайта. Ведь каждый ещё и собственное мнение имеет. И хочет это мнение другим если не навязать, то хотя бы сообщить. А здесь – такая чудная возможность! И вот изголодавшиеся по демократии пользователи принялись активно голосовать против сайтов. Точнее, их контента. Осознание того, что их мнение не просто зажжёт красную лампочку в углу, но может привести к блокированию доступа, даёт людям мотивацию. Вместо бесплатной рабочей силы создатели сервиса получили электорат. Юзеры не хотят даром работать. Но хотят решать, править, казнить и миловать. Вот – настоящий стимул.

Итог немного предсказуем. Вместо четырёх критериев, по которым предлагается оценить сайт, народ применяет один. Совсем не тот, о котором думали создатели сервиса.

Посмотрите народные оценки и комментарии для каких-либо политизированных ресурсов. Это ж натуральный остракизм!

Вот почему в таких вопросах тупые роботы лучше умных людей. У роботов нет мнения, убеждений, религиозных чувств, симпатий и антипатий. У роботов нулевая примативность. Они выполняют поставленную задачу, а не свою собственную.

white

Только через меня

Из курьёзов Chatroulette.
Такая задача была поставлена довольно давно – предотвратить обмен контактами между абонентами чата, видеочата или переписки. Чтоб не могли перейти на альтернативный канал общения.

Многие системы типа соцсетей крайне ревнивы и желают, чтобы их участники общались бы только через эти системы. И никогда – в обход. Иногда такое желание основано на бубновом интересе, поскольку сеть имеет комиссию с оказываемых услуг и заключаемых сделок. Пользователи – наоборот, норовят законтачиться напрямую и обмануть посредника (а иногда – ещё и друг друга).

Умные применяют для этого организационные и финансовые механизмы. Например, Ии-бэй, который в качестве посредника гарантирует честность сделки и возврат денег в случае чего. Не очень умные – полагаются на технические меры, например, выявляют в сообщениях и блокируют адреса электронной почты и телефонные номера. Технологии те же самые, что в DLP-системах, хотя реализация часто хромает.

К счастью, типичные приёмы видеочатеров ориентированы на передачу очень коротких сообщений, которые для DLP не актуальны. Актуален общий принцип: сделать так, чтобы инсайдер сам не пожелал искать альтернативных каналов.

white

Тёплый ламповый текст

Сегодня ваш покорный слуга отправился на крупнейший местный рынок электроники – посмотреть по просьбе друга новейшую модель читалки-букридера.

У нас все мировые хайтех-новинки появляются быстро, лишь чуть-чуть позже, чем на своей родине – в Китае.

Исследование рынка меня поразило. Потрясающее открытие состояло в том, что такой класс товара, как электронная книгочиталка в Таиланде отсутствует. Вообще. Не завозится, не производится, не локализуется и не продаётся. Многие торговцы даже не знают, что это такое. Пятый Айфон? Пожалуйста! Он уже полгода на прилавках, так что уступим всего за 1500 рублей. Букридер? Это что за зверь? Книжка электронная? Не держим-с. А зачем она? Вот, планшет самсунговский, всего 12 тыщ...

Блиц-опрос знакомых подтвердил: тайцы электронных книг не читают. Звуковые книги – слушают, фильмы и телевизор – смотрят, в том числе, с мобильных телефонов. Но воспроизводить текст на электронном устройстве, которое способно воспроизводить звук и видео – это, по их мнению, извращение. Всё равно что на самолёте ездить по земле.

И тут до меня дошло. Я же сам писал про отмирание технологий (например, чтения с бумаги или письма от руки). И если в Европе ненужные технологии умирают, то в Азии им будет проще не родиться.

Текст как носитель информации утрачивает свою роль. Технический прогресс асимптотически, но неуклонно прижимает его к нулю.

Современный человек потребляет информации больше, чем житель середины XX века и тем более – XIX века. Но форма поступающей в организм информации за сто лет существенно изменилась. Отчего бы не зашейпить текстовый канал, если он оказался не столь эффективным, как другие?

Вслед за художественными произведениями уйдут из текста в мультимедию публицистика, потом деловые документы, удостоверения. А там, глядишь, внезапно окажется, что Уголовный кодекс в картинках – гораздо информативнее, чем текстовый; легче воспринимается, ровнее толкуется, полнее описывает реальный мир.

white

Стандарт на темноту

Кое-кто из конкурентов (не будем показывать ссылкой, неприлично), объясняя потенциальным потребителям "с нуля" суть технологии DLP, определяет её как "защиту от случайных утечек данных". И потом каждый раз подчёркивает, что предотвращение именно "случайного распространения" составляет суть технологии.

Я понимаю, продукт конкурентов слишком примитивен, чтоб даже замахнуться на умышленные утечки. Я понимаю, у них такая рыночная ниша: подешевле и попроще. Я понимаю, примазаться к раскрученному "бренду" DLP хочется. Но зачем же на всю технологию наговаривать? Мы с неё кормимся, другие вендоры с неё кормятся; разовьётесь немного – тоже станете делать настоящую DLP, тоже будете на этой поляне пастись. Загаживать её не надо!

Кстати, поляна-то растёт. Согласно уверениям других наших конкурентов, в 2011 году «половина компаний, у которых еще нет DLP-системы, начнут её внедрять». Не уверен насчёт половины всех книжных магазинов и половины всех палаток "Шаурма", но какая-то часть – да, безусловно, начнёт шевелить мозгами в этом направлении. А им тут – такое откровение преподносят.

Компания выпускает добротные табуретки, покрывающие существующую потребность. Но зачем же рассказывать неграмотным крестьянам, что «диван – это деревянная мебель для сидения на четырёх ножках»? Они ж запомнят, а потом в неудобное положение попадут. А баре – смеяться будут с самого начала.

white

Терминаторы идут

По мировым СМИ разошлась новость.
«Корея продаёт в ОАЭ первый в мире автономный боевой робот "Super Aegis II", состоящий из 12,7-мм пушки с системой мониторинга и наведения с радаром и инфракрасной камерой. Эдакий примитивный Терминатор, который пока ещё не может передвигаться самостоятельно. Дальность поражения целей – 1,2 км, дальность обнаружения и распознавания – до 2,5 км, вес около 200 кг.»
Думаю, всем понятно – будущее за автоматизированным оружием.

Однако не идёт из памяти "Обитаемый остров" Стругацких. Там огромные площади были засажены подобными автоматическими турелями и прочим смерторносным железом. А выкорчёвывать всю эту нечисть отправляли каторжников, даже не солдат. И они, как ни странно, справлялись. Почему? Потому что человек всегда обманет робота, действующего по алгоритму.

Робот вместе с человеком – вот это действительно сила! Человек уступает машине не только в скорости вычислений и в реакции. Человек слаб прежде всего своим инстинктом самосохранения. И всякими вредными идейками типа "поражения своего правительства в империалистической войне". Антивирус ему в мозги не поставишь, весовой коэффициент на инстинкты не введёшь. Поэтому на опасных участках солдата следует заменить автоматизированной системой. Не из соображений гуманности, но надёжности.

Итак, тенденция введения боевых роботов очевидна. Следовательно, возрастает роль чисто информационного воздействия. Её пока что не осознали. Во всяком случае, не осознали генералы, которые по традиции мыслят в категориях рубильников и кнопок. Нужен прецедент выхода из повиновения управляемого оружия. Чтоб не просто отказ наведения или отключение связи. Чтобы роботизированный боевой аппарат открыл огонь по своим. И не в силу случайности, а по приказу противника. Лишь тогда специалисты по ИБ займут достойные места в структуре вооружённых сил.

white

Вкалывают роботы, счастлив человек

Прося высокую зарплату за свою высокую квалификацию, мы, ИТ-спецы подталкиваем изготовителей техники (через буфер в виде работодателей) к созданию решений "для чайников". Таких решений, чтобы с настройкой BGP, MPLS и IDS-сигнатур справилась бы блондинка сразу после колледжа, которая даже слов таких не знает. Она знает вместо этого иконки "синие стрелочки", "сквозной проезд" и "рыбная ловля", умеет по ним щёлкать мышкой и расставлять галки по пяти чекбоксам.

Некоторые верят, что такое со временем станет возможно. И даже весьма скоро. Другие не верят. Они в своё время не верили, что неподготовленный человек сможет управлять компьютером: "Как же он будет перфокарты пробивать, если он ни одного оператора не знает?"

Ваш покорный слуга – верует в "неуправляемые" глобальные сети. Которые не нуждаются в администрировании на 3, 4, а впоследствии и на 7 уровне. Первый и второй уровни OSI мы уже преодолели – там вмешательство человека ограничивается втыканием разъёма и проверкой, загорелся ли светодиодик.

Несмотря на отдаление пользователя (а с ним и админа) от компьютера на всё более и более высокие уровни абстракции, безработица среди айтишников, тем не менее, не настала. Зато присутствует необходимость осваивать новые знания каждый год, гнаться за прогрессом. Чуть упустишь – и ты уже не админ, а простой юзер. Ещё годик побездельничаешь – и спустился до уровня чайника. В случае занятия начальственных постов подобный регресс не страшен. А для рядовых работников приходится регулярно выучивать новую технологию, фактически, новую профессию. Но избытка кадров не наблюдается. Может быть, это за счёт экстенсивного роста Интернета? А когда Земля закончится (т.е. вся обынтернетится), тогда и наступит кадровый избыток?