Контентная фильтрация: зачем и как это делать
Привет, Хабр! Сегодня мы поговорим о фильтрации интернет-контента. Три года назад вступил в силу федеральный закон 139-ФЗ, дополнивший уже принятый 436-ФЗ «О защите детей от информации, причиняющей вред их здоровью и развитию». В соответствии с российским законодательством, доступ в интернет в школах возможен лишь «при условии применения административных и организационных мер, технических, программно-аппаратных средств защиты детей от информации, причиняющей вред их здоровью и (или) развитию». Другими словами, закон требует обязательной фильтрации интернет-контента. Добро пожаловать под кат.
Возможно, кто-то считает, что это исключительно российская новация. Вовсе нет. Практика фильтрации контента давно есть во многих странах, делается это по-разному. Например, во Франции министерство народного образования запустило автоматизированную и централизованную фильтрацию контента в школах на основании двух «чёрных списков»: в первом списке – порнографические ресурсы, во втором – расистские и антисемитские сайты. Он составлен в соответствии с общеевропейским проектом по развитию безопасного интернета (Safer Internet Action Plan).
В США «Акт о защите детей от интернета» был принят еще в 2001 году. Для фильтрации используются коммерческие фильтрующие программные пакеты, а в некоторых штатах — блокирование IP-адресов на уровне провайдера.
В Канаде в рамках проекта «Чистая связь» с 2006 года провайдеры, добровольно участвующие в программе, блокирует переход по ссылкам из «черного списка», который формируется аналитиками Канадского центра по защите детей (Canadian Centre for Child Protection). Провайдеры сами решают, как блокировать контент — по IP-адресу или доменному имени, а Sasktel BellCanada и Telus принципиально блокируют только ссылки, чтобы избежать случайного блокирования ресурсов, не содержащих запрещенного контента.
Большинство поисковых систем в Германии — Google, Lycos Europe, MSN Deutschland, AOL Deutschland, Yahoo!, T-Online и T-info — присоединились к соглашению «Добровольный самоконтроль для мультимедийных сервис-провайдеров». Они фильтруют интернет-сайты на основе списка, который определяется Федеральным департаментом по медиаресурсам, вредным для молодежи.
Самые жесткие меры в Европе установлены в Великобритании. Запрещенный интернет-контент блокируется на уровне операторов связи на основе стандарта Home Office Taskforce on Child Protection on the Internet. Кроме того, британское законодательство обязывает провайдеров отчитываться о том, принимают ли они меры по пресечению доступа к запрещенным интернет-сайтам. Интернет-провайдеры даже передают информацию в «Фонд интернет-наблюдения» (Internet Watch Foundation, IWF) и полицию о подозрительных пользователях и сетевых конференциях. Правда, это касается только распространения детской порнографии, которую в Англии фильтруют на уровне провайдеров для всех. Или, по крайней мере, пытаются.
Контентная и url-фильтрация необходима не только в библиотеках, школах и университетах, где делать это нужно обязательно.
Уже давно большинство компаний старается закрыть доступ к развлекательным ресурсам и социальным сетям для своих сотрудников. Нет нужды объяснять — почему. С другой стороны, делать это необходимо с умом. Ведь доступ к Facebook и LinkedIn для HR, PR и сотрудникам отдела продаж нужен для повседневной работы. Да, полностью закрыть доступ к ресурсам, которые в компании считаются нежелательными для посещения, нельзя. Можно обойти эти запреты, выходя в интернет со смартфона или планшета. Но хотя бы не через корпоративную сеть.
Для простоты рассмотрим настройки фильтрации контента на примере обычной школы. Настройка модуля NetPolice и правил пользователей по типу, группе и категории для любой другой организации происходит аналогично.
Что нам нужно сделать? Запретить для всех доступ к сайтам из списка Росреестра, настроить школьникам доступ только по разрешенным категориям, а учителям — доступ по всем категориям, кроме запрещенных.
1. Начинаем с создания групп пользователей. В нашем случае это группы «Учителя» и «Школьники». Разумеется, в компании необходимо будет создать больше групп: «Руководители», «Сотрудники», «PR», «HR» и так далее. Принцип создания групп пользователей тот же, что и в нашем примере.
Для создания группы пользователей переходим в раздел консоли управления «Пользователи и группы». В блоке «Пользователи и группы» во вкладке «Действия» нажимаем на ссылку «Добавить группу»:
2. Сначала создаём группу «Учителя»:
3. Теперь создаём правила для пользователей при помощи модуля NetPolice. В консоли управления переходим в раздел «Модули расширения – NetPolice – Правила» и добавляем его:
4. Называем правило «Запрет по категориям (учителя)» и выбираем категории запрета:
5. создаём пользовательское правило и выбираем тип правила «Запретить доступ»:
6. В настройке правила выбираем группу «Учителя». На этом настройка для этой группы завершена:
7. Теперь переходим к созданию правил для группы «Школьники». Сначала (пусть это не покажется странным) нам необходимо запретить доступ ко всем ресурсам:
7. Добавляем правило, разрешающее пользователям работу с DNS (53 порт), чтобы выход в интернет был возможен. Для этого создаём правило «DNS-клиент», выбираем протоколы TCP/UDP и изменяем диапазон портов назначения на 53 порт:
8. Теперь добавляем пользовательское правило, разрешающее ученикам просмотр сайтов:
9. В отличие от группы «Учителя», которой разрешено посещать любые ресурсы, кроме запрещенных, пользователи из группы «Школьники» могут попасть только на определенные интернет-ресурсы:
10. Создаём новую категорию и подтверждаем автоматическое создание нового правила на разрешение:
11. И, наконец, настраиваем правило для работы с группой «Школьники».
12. Возвращаемся к настройкам групп пользователей, ведь нам еще необходимо, чтобы весь трафик проходил через прокси-сервер и блокировался при запросах мимо прокси.
13. Первыми в списке должны идти правила на разрешения. Для группы «Учителя» правило «Запрет по категориям (учителя)» добавляется автоматически:
Нам осталось только внести пользователей в определенные группы и проверить правильность настроек, перейдя по ссылке www.smart-soft.ru/ru/solutions/check-federal-law/.
Этим возможности Traffic Inspector не ограничиваются. Кроме контентной фильтрации мы можем, создав так называемый «черный» список, запретить доступ к определенным сайтам, которые могут не быть включены в уже запрещенные категории. Например, таким образом в компании можно запретить для определенных категорий сотрудников доступ к социальным сетям и развлекательным сервисам.
Подробнее о настройках «черного» списка здесь.
Если наши читатели знают другие интересные решения этой проблемы, как всегда, приглашаем к обсуждению.
Источник
Как научиться фильтровать информацию
Специфическим качеством самой информации (в отличие от знания) являются ее избыточность и фрагментарность. Обилие информации неизбежно приводит к поверхностности: сначала восприятия, затем — мышления.
Картина мира современного человека состоит из знаний, приобретенных посредством собственного опыта, примерно лишь на 10-15%. Основным же каналом получения информации, способом приобщения к миру и его событиям, являются именно средства массовой коммуникации, творящие информационный мономир. Именно через систему коммуникации и информации большинство членов общества подчиняются единому поведению, представлениям, увлечениям, моде и ценностным стереотипам.
Поль Валери сравнивает ощущение «потерянности» и «удрученности», охватывающее современного человека, имеющего доступ в цифровом формате ко всем художественным феноменам, с тем, которое охватывает человека в музее. Здесь «продукция бесчисленных часов, потраченных столькими мастерами на рисование и живопись, обрушивается в несколько мгновений на ваши разум и чувства». Под влиянием «этого бремени» «мы становимся поверхностными. Или же делаемся эрудитами».
В демократическом обществе присутствует определенная закономерность: финансовые потоки соответствуют потокам информационным по направленности и по интенсивности. Здесь присутствует прямая зависимость. По интенсивности денежных потоков можно представить сферы информационной активности в обществе. В свою очередь движение политических партий и личностей к власти (особенно в период парламентских и президентских выборов) сопровождается усиливающимся потоком информации вокруг этого движения. По интенсивности информационных потоков, их содержанию можно увидеть намерения лиц и партий.
В отличие от энтропии, неопределенности или хаоса, информация должна иметь определенность. Информация, исходящая от определенного источника, должна быть систематизирована, выстроена, ориентирована.
Второе качество информации связано с такой ее характеристикой, как ценность, полезность или бесполезность. О ценности информации можно говорить тогда, когда она способствует достижению определенных целей человеческой деятельности. Здесь очень важен элемент новизны информации. Упорядочивающая деятельность человека, которая уменьшает хаотичность среды, основывается как раз на ценности и полезности, новизне информации.
Еще одним важным качеством информации является ее избыточность. Избыточность сообщения в суждениях повышает их убедительность и делает более достоверными. С другой стороны, чрезмерная избыточность, в которой «тонет» суть вопроса, снижает ценность информации.
Есть общий критерий, позволяющий определить наличие упорядоченности, ценности, новизны и избыточности информации. Этот критерий вытекает из принципов кибернетики. Информация — все то, что вводится в систему в целях управления ею. Если сообщение не удовлетворяет требованию — оно не информация.
Как в океане информации найти ту, которая необходима для деятельности субъекта управления? Информационное поле становится организованным, если появляются цель, проект, замысел. Они предопределяют отношение к отбору и анализу информации. Это отношение пробуждает внимание, в результате чего из потоков информации вылавливаются нужные сообщения, факты, события.
Таким образом, информация — это результат взаимодействия замысла и внимания. Иными словами, информация — это: замысел — внимание — ключевое слово или понятие. Все остальное — информационный шум.
Методы анализа информации
Информация может оцениваться по степени важности, точности (достоверности) и значимости. Важная информация та, которая полезна для вас, фирмы, организации или корпорации. Точность информации оценивается по надежности источника и по надежности самой информации. Проверка этой надежности осуществляется по другим источникам. Оценка важности и точности информации называется ее анализом.
О значимости информации можно судить, исходя из двух понятий: циркуляции и синтеза. Циркуляция — это быстрота прохождения информации среди заинтересованных лиц с целью взаимодействия с информацией иного плана, что позволяет найти решение проблемы или отыскать ответ на сложный вопрос. Синтез — это соединение различных отрывков информации для воссоздания полной картины того или иного процесса. Таким образом, если информацию можно использовать для циркуляции и синтеза — это значимая информация.
Сам процесс использования информации начинается с отбора фактов, оценки их, определенного истолкования, построения на их основе гипотезы, с помощью которой можно составить связное представление обо всем изучаемом явлении и взаимосвязи отдельных его элементов. Далее делается попытка подтверждения гипотезы благодаря приемам циркуляции и синтеза. Здесь важно прибегать к мнению разных лиц, выступающих с различных позиций. Это уменьшает вероятность ошибки.
Анализ информации — чрезвычайно важный этап. От выводов, которые делаются на его основе, зависят судьбы людей, компаний, фирм, предприятий, организаций, партий, движений — в конце концов, государства.
Поиск решений на основе анализа и синтеза информации осуществляется двумя методами: «гипотезы» и «намерения». Метод «гипотезы» заключается в том, что гипотеза строится исходя из имеющейся информации, имеющихся фактов. Гипотеза при этом может быть не одна. Тогда между ними обнаруживаются противоречия. В данном случае надо придерживаться «худшей» гипотезы.
Метод «намерения» состоит в том, что определяется действующее лицо, чьи намерения соответствуют имеющимся фактам. Здесь важно понять те цели, которые преследует это лицо, чтобы предугадать его возможные действия.
Какая информация вам нужна
Замысел связан с действием. Значит, полезная информация не может появиться без связи с действием. Абсолютной информации не существует, а есть только информация по отношению к намерениям лица, которое опрашивает внешний мир для того, чтобы действовать в этом мире и воздействовать на этот мир. Что для одного является информацией, для другого — просто шум.
Ясно, что наличие качественной полезной информации в нужный момент позволяет принимать правильные решения. Но как собирать качественную информацию, если неизвестно какие решения придется принимать? Какую информацию следует собирать с учетом ее потенциальной полезности для будущих решений? Здесь нужна такая структура действий по сбору информации: цели — потребности — информационные базы.
Цели для личности или организации могут быть стратегические, тактические и оперативные. Каждая из этих целей ориентируется на свой вид информации (стратегическую, тактическую и оперативную). Каждый вид информации имеет разные базы для наблюдения.
Информация для стратегических решений. Стратегические цели определяют главные, принципиальные пути развития организации. Стратегические цели определяют стратегические потребности в информации. Перечень потребностей в стратегической информации предполагает максимальную полноту. Нередко события, не имеющие прямого отношения к деятельности организации, вдруг оказывают немалое влияние на ее судьбу.
На основе потребностей в стратегической информации создается база данных, в которой предусмотрены основные направления для отслеживания информации. Вот как может выглядеть база данных для промышленной фирмы:
- тенденции по странам (развитие экономики, динамика данного промышленного производства и т. д.);
- технологический процесс (сырье; производственные технологии; окружающая среда, оказывающая влияние на деятельность фирмы, и т. д.);
- действующие лица (действующие конкуренты и информация о них; потенциальные конкуренты и информация о них);
- диверсификация (наблюдения за теми областями деятельности, где используется продукция фирмы).
Стратегическую базу данных можно рассматривать и через сферу действий организации. Эта сфера действий состоит из трех областей, которые становятся основными разделами базы данных:
- непосредственная сфера действий организаций (производство, технология, поставщики, потребители, конкуренты);
- сфера влияния (все факторы, что могут оказать влияние на непосредственную сферу действий);
- сфера интересов (области, которыми организация пока не занимается, но может заняться в будущем, потенциальные конкуренты).
Информация для тактических решений. Если стратегическая цель для организации — ответ на вопрос, куда идти, то тактическая цель — это ответ на вопрос, как идти. Тактическая цель предполагает и тактические потребности в информации. На основании этого строятся тактические базы данных. Они могут быть двух типов.
Тактические базы данных первого типа («по запросу»). Основные направления (разделы) этой базы на примере промышленной фирмы могут быть следующие:
- запуск в производство новой продукции требует ответа на вопросы: какие изделия сегодня конкурируют на рынке, над чем работают конкуренты, кто может перекрыть каналы сбыта, благоприятствует ли новой продукции законодательство (если нет, можно ли внести в него изменения);
- наращивание производственных мощностей: какой будет спрос на продукцию, надо ли увеличивать производственные мощности, каковы будут затраты, как поведут себя конкуренты;
- создание производства за рубежом: политическая информация (стабильность режима, уровень коррупции и т. д.), социально-культурная информация (качество рабочего персонала, профсоюзная активность и т. д.), экономическая информация (стоимость земли и строительных работ, налоговая система и т.д.);
- отслеживание информации о тех факторах, которые могут оказать влияние на деятельность фирмы. Прежде всего это касается информации о конкурентах. Затем важна информация о видах настоящей и будущей продукции, о производственных мощностях и технологии, о патентной и лицензионной активности, о зонах и территориях конкурентной борьбы.
База данных для решения оперативных вопросов. Эта информация складывается из данных о наиболее выгодных поставщиках, о клиентах фирмы-конкурента, о возможных угрозах деятельности своей фирмы (например, банкротство субподрядчика и т. д.) Подобная информация должна быть точная и надежная, ибо на ее основе оперативно вырабатываются необходимые меры, руководство принимает и осуществляет быстрые решения. Оперативная база данных включает в себя следующие разделы: конкуренты, их коммерческая политика; цены на продукцию, рекламные кампании конкурентов; поставщики; клиенты; субподрядчики, система торговли и т. д.
От отдельных баз данных к группам баз. Для любой фирмы есть устойчивые постоянные объекты наблюдения, информация о которых используется в стратегических, тактических и оперативных целях. Например, это касается деятельности конкурентов. Поэтому отдельные базы данных можно объединить в определенные группы баз, в основе которых — постоянные объекты наблюдения. Эти группы баз, в которых отслеживается информация одновременно на стратегическом, тактическом, оперативном уровнях, могут быть созданы по следующим основаниям:
- конкуренты (вся информация по действующим и потенциальным конкурентам);
- технология и производство;
- ресурсы (материально-техническое обеспечение производственного процесса фирмы, сырье, комплектующие детали, рабочий персонал, финансы);
- рынок (цены, налоги, запросы, сбыт);
- законодательство (информация но законодательству, затрагивающему интересы фирмы, информация о проектах новых законодательных актов);
- общество (политическая, экономическая, социальная, демографическая и другая информация).
Таким образом, чтобы получить качественную информацию, необходимо сформулировать цели, определить потребности и построить базы данных. Опыт и отечественная практика фирм показывают, что достаточно шесть баз для отслеживания информации: конкуренты, технология и производство, ресурсы, рынок, законодательство, общество.
Aннa Влaдимиpoвна Kocтина — доктор философских наук, профeccор, заведующая кафедрой философии, политологии и культурологии Московского гуманитapного унивеpcитета (МocГУ), эксперт центра дистанционного образования «Элитариум»
Источник