КАК ИЗ ПОТОКА ИНФОРМАЦИИ ВЫДЕЛИТЬ ТО, ЧТО НУЖНО

 


Сегодня основополагающий вопрос – как справиться с растущими объёмами информации и как с учётом этого приготовиться к будущему.

Не скажу ничего нового, если отмечу, что рост объемов данных большей частью обеспечивается машинами, а не людьми. В качестве примера задумаемся над тем, сколько информации может сгенерировать всего одна камера видеонаблюдения с высокой разрешающей способностью. Если добавить к этому весь объём, созданный ИТ-системой исходя из требований безопасности или других действующих нормативов, то можно легко прийти к выводу, что работа с таким объемом данных - неразрешимая проблема.

Кроме того, сегодня многие предприятия всерьёз взялись за искусственный интеллект, и он столько нагенерировал, что становится ясно - нужна новая стратегия, масштабируемая и гибкая.

В этом контексте интересно отметить растущее понимание того, что данные, генерируемые человеком, играют важнейшую роль в обучении новых моделей искусственного интеллекта и предотвращении так называемого коллапса модели. Качество информации, созданной человеком, выше, чем информации, созданной машиной.

ОРИГИНАЛЬНЫЙ ТЕКСТ НАХОДИТСЯ ЗДЕСЬ.

Рост объемов информации и его значение.

Появилась цифра, что 90% информации, доступной в нашем мире, было получено в последние два года. Отсюда следует, что объём информации, полученной в несколько ближайших следующих лет, быстро превзойдёт всё то, что доступно сегодня. Такой экспоненциальный рост криком кричит о том, что пора позаботиться о средствах для размещения, хранения и защиты информации, поскольку со временем связанные с этим проблемы будут только возрастать.

Информационная гравитация означает не только то, что чем больше базы данных, тем сложнее их перемещать, но и то, что они будут «притягивать» базы меньших размеров, тем более что они, скорее всего, будут связаны между собой на уровне приложения. Это еще больше усугубляет проблему, поскольку возникают гигантские информационные кластеры, с которыми приложениям будет труднее работать.

 

Как же с этим справиться?

Для решения проблем, связанных с ростом объема данных, можно порекомендовать несколько стратегий.

СТРАТЕГИЯ 1

Гибридные решения: используются большинством крупных организаций, часть данных находится на локальных носителях, а часть – в общем облаке. Однако в контексте хранения данных крайне важно понимать последствия этой ситуации с точки зрения стоимости, безопасности и устойчивости данных, а также иметь возможность вносить изменения сразу же после выявления проблемы. С увеличением размеров баз этих проблем будет всё больше и больше. Человек, ответственный за принятие решений, должен постоянно спрашивать себя: «Будет ли моё решение работать и тогда, когда размер базы увеличится в десять раз?». Это только кажется, что много, но при росте в 40% для десятикратного увеличения требуются какие-то несчастные семь лет. Также важно, чтобы при необходимости перемещения данных операцию можно было выполнить максимально просто — без необходимости внесения дополнительных изменений в программное обеспечение и инфраструктуру.

СТРАТЕГИЯ 2

Гибкое потребление ресурсов для новых запросов: Режим ondemand локальных систем хранения позволяет не только справляться с непредвиденными запросами, но и лучше понимать текущие потребности, а также прогнозировать рост баз данных для новых приложений. Кроме того, это облегчает плавный переход на инфраструктурные платформы, находящиеся в собственности организации, по мере прояснения задач.

СТРАТЕГИЯ 3

Не отставать от растущих требований к безопасности и устойчивости данных: это связано с ростом числа атак программ-вымогателей и ужесточением нормативных требований. Это может привести к ещё большему разбуханию баз данных, поскольку большая устойчивость обычно сводится к увеличению числа копий и появлению дополнительных систем для их мониторинга и управления. Поэтому ищите решения, которые обеспечивают хранение данных с низкими накладными расходами, а также обеспечивающие быстрое восстановление – требования к скорости восстановления тоже постоянно растут.

СТРАТЕГИЯ 4

Устойчивость: расходы на неё также необходимо учитывать. Эти требования включают мониторинг энергоэффективности, а также «углеродный след» систем. Энергоэффективность в данном случае -  производительность, приходящаяся на один ватт мощности. Экологические затраты должны быть на протяжении всего жизненного цикла оборудования, включая установку, работу и вывод из эксплуатации.

СТРАТЕГИЯ 5

Долгосрочное архивирование: При выборе решения для архивирования и длительного хранения данных (локально или в облаке) важно учитывать, что затраты будут сильно зависеть от того, используются ли в данные в настоящий момент или являются полностью «холодными» (например, старые архивы или бэкапы). Оценивайте совокупные расходы, исходя из реального соотношения доступных и холодных данных. Это включает не только стоимость поиска в облачных объектных хранилищах, но и платежи за внешние хранилища, а также затраты на поиск, транспортировку и время восстановления данных с таких носителей, как ленточные архивы.

СТРАТЕГИЯ 6

Особенности работы с видео: сегодня доля видеоматериалов в информационных ресурсах мира оценивается в 50 %, поэтому определенно имеет смысл использовать специальные стратегии для работы с ним. Прогресс в области архивирования данных, хранения только нужных выборок и оптимизации архитектуры хранения в целом помогли максимально снизить требования к хранению этих данных, однако требования к доступу к данным также изменились. Большие объемы видеоданных логично архивировать, но достижения в области компьютерного зрения и систем искусственного интеллекта привели к тому, что люди захотели анализировать и понимать их. Это означает, что теперь требуется хранилище, разработанное для хранения огромных объемов данных и поддерживающее одновременный доступ большого количества пользователей. Флэш-хранилище, вмещающее большой объём данных, может удовлетворить как требования к экономически эффективному хранению, так и обеспечить доступ к данным с требуемым уровнем производительности.

Многие сетуют на то, что после крушения Советской власти бюрократов стало не меньше, а ещё больше. А ведь ларчик открывается просто — объём обрабатываемой информации экспоненциально растёт по мере роста экономики. Поэтому рост числа бюрократов — типичный случай массового явления, когда проблему с информацией решают экстенсивным методом, наращивая штат учётчиков вместо внедрения эффективных технологий. Подобные попытки «залить проблему людьми» наблюдаются во многих отраслях. Однако экстенсивный подход имеет пределы и становится дорогостоящим, в то время как интенсивные методы — правильная архитектура данных, автоматизация — позволяют справляться с растущими объёмами информации эффективно. Организации, откладывающие переход к современным подходам управления данными, рискуют оказаться в ситуации, когда проблема станет критической. Сколько ещё есть времени для принятия, пока информационная лавина поддаётся контролю, мы все узнаем очень скоро.

 

ВЕРНУТЬСЯ К ГЛАВНОМУ МЕНЮ

ЧТОБЫ БЫТЬ В КУРСЕ ПОСЛЕДНИХ НОВОСТЕЙ, ПОДПИСЫВАЙТЕСЬ НА Telegram-канал «КАРЬЕРА ИТ-МЕНЕДЖЕРА».