Распределенная аналитика за пределами облака
Аналитика - это очень общий термин для сопоставления и обработки необработанных данных для получения более полезных результатов. Алгоритмы аналитики могут быть такими же простыми, как сокращение или усреднение данных по потоку показаний датчиков, или сложными, как самые сложные системы искусственного интеллекта или машинного обучения (AI / ML). Сегодня аналитика обычно выполняется в облаке, поскольку это наиболее масштабируемое и экономичное решение. Однако в будущем аналитика будет все больше распространяться по облаку, периферийным вычислениям и конечным устройствам, чтобы воспользоваться преимуществами их улучшенной задержки, пропускной способности сети, безопасности и надежности. Здесь мы обсудим некоторые архитектуры и компромиссы, связанные с распространением аналитики за пределами традиционного облака.
Как распределенная аналитика увеличивает ценность
Простая аналитика включает сокращение, корреляцию и усреднение данных, в результате чего выходной поток данных намного меньше входных данных. Рассмотрим систему подачи пресной воды в большое здание. Было бы полезно знать давления и потоки в различных точках системы, чтобы оптимизировать насосы и контролировать потребление. Это может включать в себя множество датчиков давления и расхода, размещенных вокруг распределительного трубопровода. Программное обеспечение периодически опрашивает датчики, регулирует настройки насоса и создает отчет о потреблении для управляющих зданием. Но необработанные показания датчиков могут вводить в заблуждение - например, кратковременное падение давления при промывке прибора. Алгоритмы аналитики могут усреднять показания одного датчика с течением времени, а также комбинировать и соотносить показания нескольких датчиков для создания более точной и полезной картины условий в трубопроводах. Все эти показания можно было бы отправить в облачную аналитику, но это была бы гораздо более эффективная архитектура, если бы датчики сами выполняли некоторые усреднения, а локальные периферийные компьютеры выполняли корреляцию и составляли отчеты. Это распределенная аналитика, которая может повысить эффективность, точность и стоимость многих аналитических систем.
Аналитика усложняется, когда используются методы AI / ML. AI / ML обычно работает в два этапа:
Этап построения модели, на котором большие объемы данных обрабатываются для создания модели для системы AI / ML.
Фаза вывода, на которой эта модель применяется к данным, текущим в системе, для получения желаемых результатов, часто в режиме реального времени.
В современных системах модели почти всегда строятся в больших серверных фермах или в облаке, часто как автономный процесс. Затем полученные модели AI / ML упаковываются и отправляются в различные системы, которые запускают фазу вывода моделей на реальных данных, генерируя желаемые результаты. Фаза вывода может выполняться в облаке, но в последнее время была продвинута к границе, чтобы улучшить задержку, пропускную способность сети, надежность и безопасность. При принятии решения о том, какой уровень вычислительных ресурсов использовать для каждой фазы, стоит подумать о компромиссах.
Фаза вывода AI / ML
Фазу логического вывода AI / ML относительно легко распределить между несколькими процессорами однорангового уровня или вверх и вниз по иерархии уровней обработки. Если модели предварительно вычислены, данные, на которых работают алгоритмы AI / ML, могут быть разделены между несколькими процессорами и обрабатываться параллельно. Разделение рабочей нагрузки между несколькими процессорами однорангового уровня обеспечивает преимущества емкости, производительности и масштабирования, поскольку по мере увеличения рабочей нагрузки можно задействовать больше вычислительных ресурсов. Это также может повысить надежность системы, поскольку соседние процессоры все еще доступны для завершения работы в случае отказа одного из процессоров. Логический вывод также можно разделить между несколькими уровнями иерархии, возможно, с разными частями алгоритма, работающими на разных уровнях процессора. Это позволяет логически разделить алгоритмы AI / ML, позволяя каждому уровню иерархии выполнять наиболее эффективное подмножество алгоритма. Например, в системе искусственного интеллекта / машинного обучения видеоаналитики интеллект камеры может выполнять адаптивное повышение контрастности, передавать эти данные на периферийные компьютеры для извлечения признаков, отправлять их в соседние центры обработки данных для распознавания объектов и, наконец, в облако. может выполнять высокоуровневые функции, такие как обнаружение угроз или создание тепловой карты. Это может быть очень эффективное разбиение. и, наконец, облако может выполнять высокоуровневые функции, такие как обнаружение угроз или создание тепловой карты. Это может быть очень эффективное разбиение. и, наконец, облако может выполнять высокоуровневые функции, такие как обнаружение угроз или создание тепловой карты. Это может быть очень эффективное разбиение.
Этап изучения алгоритмов AI / ML
Фазу обучения алгоритмов AI / ML труднее распределить. Проблема в размере контекста. Чтобы подготовить модель, система AI / ML берет большие пакеты обучающих данных и обрабатывает их с помощью различных сложных алгоритмов этапа обучения для создания модели, которую относительно легко выполнить на этапе вывода. Если на данном вычислительном узле доступна только часть обучающих данных, у алгоритмов возникнут проблемы с обобщением модели. Вот почему обучение чаще всего проводится в облаке, где память и хранилище практически неограничены. Однако некоторые сценарии требуют, чтобы алгоритмы обучения были распределены между несколькими одноранговыми вычислительными узлами или вверх и вниз по иерархии от облака до границы. В частности, обучение на периферии позволяет процессу обучения собирать множество обучающих данных с близлежащих датчиков, и действовать в соответствии с ним без участия облака, что улучшает задержку, надежность, безопасность и пропускную способность сети. Для решения этих проблем в настоящее время разрабатываются передовые алгоритмы распределенного обучения.
Вопросы, отзывы, комментарии (0)
Нет комментариев