Дирк Джентли — один из самых странных вымышленных персонажей Дугласа Адамса. [1] Его девизом было Все взаимосвязано. Как оказалось, современные технологии доказали правоту Дирка. Сегодня, благодаря Большим Данным, мы теперь можем соединять все со всем остальным и получать мгновенные данные от каждого из этих подключений.

Тем не менее, эта ситуация также представляет собой новый набор проблем. Очевидно, что некоторые связи будут более важными, чем другие. Таким образом, для бизнес-лидеров проблема состоит в том, чтобы: а) выяснить, какие связи наиболее важны, и б) убедиться, что у них есть инфраструктура и возможности для принятия мер на основе этой информации.

Несмотря на ажиотаж вокруг больших данных, искусственного интеллекта и машинного обучения, цель стратегии разведки большинства ИТ-директоров остается довольно традиционной: обеспечить более быстрые и обоснованные решения на всех уровнях для достижения бизнес-результатов, влияющих на рост выручки, прибыль на акцию или EBITDA в долгосрочной перспективе. срок. Предполагается, что большие данные облегчат эту задачу. Тем не менее, многие предприятия не смогли извлечь выгоду из обещаний, которые предлагают эти новые технологии.

Почему? Ответ не в самих больших данных. Напомним, что большие данные — это не что-то новое. Большие данные существуют с тех пор, как появилась технология мейнфреймов, и сегодняшнее определение больших данных будет меркнуть по сравнению с тем, что мы увидим через 10 лет. Скорее, проблема заключается в том, что большие данные продаются таким образом, что не учитываются контексты, в которых они используются. Реальность такова, что большинство архитектур данных и аналитики просто не готовы к будущему, включающему большие данные и IIOT. В лучшем случае они почти готовы. И это почти то, что делает их уязвимыми.

Алеа Джакта Эст?

Правда в том, что предприятия не могут решить свои проблемы с большими данными без модернизации своей аналитической архитектуры, чтобы легко подключаться к этим богатым источникам информации, проводить анализ и, что наиболее важно, получать действенные результаты. Ключевой термин здесь легко. Поскольку современная архитектура больших данных настолько сложна, что требует многоуровневых процессов для перемещения, подготовки и обработки данных перед их анализом, возникает проблема 1) определения каких данных, к которым необходимо получить доступ, а затем 2) фактического доступ к нему остается трудным. Эта проблема, до сих пор не решенная, продолжает определять развитие аналитических моделей, если не технологического ландшафта в целом.

Сегодня рынок находится в точке перегиба. Лидеры мнений, такие как McKinsey и PwC[2]», постоянно предупреждают организации, что IIoT — это нечто большее, чем новая игра в мяч, чем многие думают. Слишком часто этот совет остается без внимания. Скорость и точность пользовательской аналитики и принятия решений что, если теперь являются абсолютным требованием для бизнеса. И хотя иерархическое мышление всегда будет с нами, оно просто не может соответствовать следующему рубежу оптимизации данных и облака или помочь раскрыть огромный потенциал IIoT, чтобы предоставить нам прогнозную аналитику.

Как провозгласил Юлий Цезарь, перейдя Рубикон, «Alea jacta est. Жребий брошен. Но в отличие от него, мы перешли рубикон ИТ, сами того не осознавая. Чем дольше мы ждем, чтобы принять все, что влечет за собой это изменение, тем больше мы отстаем от тех, кто уже это сделал.

Большие данные? Или данные экосистемы?

Хотя большие данные дают нам огромный потенциал для переосмысления информационного ландшафта, многие представители делового мира по-прежнему склонны мыслить категориями платформ и иерархических структур. (Возможно, это результат того, что эволюция человека происходила в основном в рамках иерархических структур.) Однако теперь, возможно, пришло время думать не с точки зрения иерархий, а с точки зрения экосистем. Это дает нам более продуктивную основу для размышлений о том, как на самом деле структурированы данные: как сети сетей, некоторые из которых тесно связаны, а другие нет, со сложной и динамичной взаимосвязью, которая меняется почти каждый момент. [3]

За последние 20 лет организации инвестировали миллиарды в системы бэк-офиса и их постоянную интеграцию. Хотя системы управления взаимоотношениями с клиентами, управления цепочками поставок и планирования ресурсов предприятия изначально разрабатывались для поддержки критически важных бизнес-операций, вскоре они стали основой данных для бизнеса.

Извлечение информации из этих разрозненных и закрытых систем остается сложной задачей для технологов; стремление решить эту проблему привело к появлению инструментов интеллектуального анализа данных, решений для бизнес-аналитики и растущему рынку облачных вычислений. Несмотря на это, в большинстве случаев сетевые решения означают просто исправление устаревших систем. Действительно, несмотря на то, что операционная отчетность и информационные панели теперь жестко закодированы в бизнес-процессах, возможность проведения быстрых специальных исследований, чтобы понять, почему что-то произошло или что могло произойти, все еще остается недосягаемой.

От GIGO к MIMO?

Мы все знаем аббревиатуру GIGO: Garbage In, Garbage Out. Однако сегодня проблема не столько в мусоре, сколько в посредственности: слишком многие компании используют KPI, которые достаточно хороши, или просто имитируют то, что используют их конкуренты, или используют их, потому что они удобны. Результат? Большинство организаций сильно отстают от своих показателей. Наиболее проблематичным является то, что эти организации, как правило, не могут определить показатели производительности, которые действительно предсказуемы. [4]

Многие компании и независимые поставщики программного обеспечения позиционируют себя как способные решить эту проблему. Однако слишком многие из этих решений используют подход «черного ящика» к продаже технологий. Этот подход «черного ящика» ограничивает пользователей, создает пробелы в информации по всему предприятию и часто удерживает информацию от тех, кто может изменить ситуацию. Почему до сих пор так делают? Частью ответа является стоимость: несмотря на эволюцию интеллектуальных устройств и постоянно децентрализованную рабочую силу, централизованное мышление по-прежнему ощущается в рамках бюджета или не так дорого. Однако в основном локальные технологии (ERP, BI, CRM и SCM, и это лишь некоторые из них) отражают мышление, все еще основанное на иерархическом мышлении.

Как это исправить? Благодаря быстрому прогрессу во всем, от микросхем памяти (например, новых микросхем Micron, оптимизированных для машинного обучения) до математики, лежащей в основе машинного обучения (например, теории графов), мы можем быстро анализировать огромные объемы данных и даже кажущиеся несвязанными данные. Но нам нужны новые архитектуры. Точно так же, как Micron разработала чипы, которые охватывают неструктурированный и беспорядочный мир реальных данных, мы также должны использовать новые и неиерархические ИТ-архитектуры. Пришло время перейти от GIGO к MIMO: множественный вход, множественный выход.

Три передовые компании

Ускорение обработки данных с помощью прикладного искусственного интеллекта и машинного обучения: U2 Science Labs

В течение многих лет для работы с приложением Data Science требовался высококлассный количественный PHD или очень дорогая лицензия SAS (или и то, и другое). Сегодня наука о данных становится все более доступной для неспециалистов. Одна многообещающая компания U2 Science Labs, основателей которой вдохновлял собственный опыт решения реальных задач в области науки о данных для компаний из списка Fortune 2000. Они увидели, где наука о данных была неэффективной, немасштабируемой и сложной для производства. Их продукт, Advanced Insight Portals, основан на запатентованной системе искусственного интеллекта – Auto-Curious. – который работает на масштабируемой и производительной платформе облачной аналитики. Технология U2 разработана с одной целью: предоставить бизнес-пользователям доступ по требованию к простым в использовании, но продвинутым прогнозным данным.

Многие бизнес-лидеры вкладывают значительные средства в понимание семантики своих данных (с помощью семантического индекса или схемы), используя такие компании, как GE Predix, SAP Hana или даже кластер Hadoop. Это может быть ценным упражнением. Проблема в том, что использование семантических графов для выяснения того, что интересно в ваших данных, часто служит лишь для создания длинного списка того, что с ними нужно делать. Если принять меры, этот растущий список возможностей быстро исчерпает возможности существующих групп специалистов по обработке и анализу данных, которые сами заняты попытками реализовать следующий проект.

Auto-Curious, напротив, использует семантическое понимание данных и создает график вопросов, который сопоставляется с задачами науки о данных, позволяя бизнес-пользователям, случайным пользователям, вашей бабушке задавать вопросы о больших сложных наборах данных и получать предсказуемые ответы, которые позволяют лучшее принятие решений. Â Auto-Curious выполняет более приземленные и очевидные задачи в рамках науки о данных, те, которые повторяются и легко изучаются его метаобучающим уровнем. Поскольку этот процесс автоматизирован, он обеспечивает почти неограниченный доступ к расширенным аналитическим вопросам. Действительно, Auto Curious вдохновлен идеей, что если вы примените машинное обучение к машинному обучению, вы сможете изменить мир!

Поскольку корпоративный рынок все активнее инвестирует в свои активы данных в семантических технологиях (таких как GE, ABB, Schneider, SAP), бизнес-руководителям будет все труднее решать проблемы, связанные со способностью быстро формировать идеи, влияющие на бизнес. Auto-Curious от U2 представляет собой масштабируемую технологию, позволяющую лидерам быстро использовать свои инвестиции в данные для создания полезных идей. Посмотрите видеоролики, созданные совместно с партнером.

https://youtu.be/OyuZfxadaGg

Прогнозная аналитика + экспертное человеческое суждение = суперсила больших данных

Еще одна реальность, которую мы должны принять, заключается в том, что при всей потенциальной силе больших данных ценность анализа будет зависеть от знаний и опыта человека, который его проводит. Одним из ключей к созданию действительно действенного анализа является объединение статистических и информационных возможностей прогнозной аналитики и машинного обучения с экспертными человеческими суждениями. Скаутинг в бейсболе представляет собой полезный прототип. Там высокие ставки игры побудили клубы интегрировать прогностическую аналитику (sabermetrics) в суждения людей-скаутов. Самые лучшие клубы разработали архитектуру данных, которая объединяет эти два подхода в действенные показатели.

Использование больших данных для машин и операций: ThinkIQ

Когда ваша архитектура посредственная, сбор данных остается утомительным ручным процессом, который резко ограничивает продуктивное время, необходимое для предоставления бизнес-пользователям полезной информации. Понятно, что нужен новый подход. Крупным производителям особенно необходимо использовать и повышать ценность информации на своем предприятии, чтобы делать прогнозные выводы.

Чтобы было ясно: производственный анализ действительно высвобождает производительность и прибыльность. Однако многие аналитики не понимают, что самый большой денежный поток на заводе возникает не при покупке активов, а при движении материалов. При рассмотрении ресурсоемких отраслей (например, нефтеперерабатывающих заводов) ошибкой является сосредоточение внимания на основных активах вместо операций. В то время как производственные компании тратят огромное количество времени на принятие решения о том, покупать или нет машину, которая прослужит 20 лет и будет стоить 1 миллион долларов, операции могут легко тратить материалы и энергию на сумму более 1 миллиона долларов в месяц, и никто даже не заметит!

С другой стороны, эффективный завод может обслуживать больше клиентов, если он хорошо работает. Но хотя техническое обслуживание и безопасность являются необходимыми задачами, деньги приносят операции.

Это, возможно, то, что GE ошибается в своем подходе Predix. На самом деле время безотказной работы и время простоя составляют лишь небольшую часть рентабельности производственных активов; возможность состоит не в том, чтобы улучшить техническое обслуживание и время безотказной работы оборудования, а в том, чтобы использовать все активы в цепочке поставок — как основные средства (оборудование), и текущие активы (инвентарь) обеспечить максимальную ценность для клиента при минимально возможных затратах.

ThinkIQ решает эту проблему инновационным способом. Цель ThinkIQ давняя: предоставить производителям уникальное представление о движении материалов, данных о процессах и данных о качестве, чтобы эти производители могли снизить себестоимость продаваемых товаров, повысить эффективность и мощность производства, увеличить стоимость произведенной продукции и уменьшить оборотный капитал, привязанный к запасам. ThinkIQ обеспечивает совместное интеллектуальное производство от фермы до вилки, от датчика до акционера и от концепции продукта до завершения. Это позволяет всей организации работать вместе способом, который заметно отличается от традиционного подхода к использованию отдельных приложений для цепочки поставок, движения материалов, данных процесса и анализа качества.

Целостное мышление о данных: Knowi

Одним из основных препятствий, мешающих внедрению проектов больших данных и IIoT, является сложность надежного и эффективного распространения информации по всему предприятию. Аналитический стартап Knowi решает эту проблему. Их решение состоит в том, чтобы смотреть на корпоративные данные целостно, рассматривая все данные в равной степени, независимо от размера, структуры или скорости. Их платформа Adaptive Intelligence изначально интегрируется со структурированными и неструктурированными источниками, устраняя необходимость перемещения данных из исходного источника для проведения аналитики. Устраняя процессы ETL, Knowi удаляет уровни ненужной обработки, которые в противном случае усложняли бы анализ данных, но не добавляли ценности.

Интегрируя ИИ в свою платформу, Knowi делает прогнозную и предписывающую аналитику доступной во всех рабочих процессах аналитики, используя все доступные данные. Это ставит Knowi в группу небольших компаний, предлагающих решения бизнес-аналитики, которые продвигают аналитику больших данных и Интернета вещей в массовое русло.

Что требуется для аналитики данных нового поколения?

В то время как многие приложения предоставляют информацию в определенные моменты времени или прогнозируют результат на основе ручного ввода, сам процесс принятия решений по-прежнему требует опыта и интерпретации эксперта-человека. Самое главное, для этого требуется, чтобы эксперт имел доступ к вашим данным.

Корпоративный ИТ-подход должен быть направлен на внедрение этих новых технологий таким образом, чтобы они либо дополняли существующую инфраструктуру или наборы решений, либо полностью их заменяли. Сегодня наиболее многообещающими новыми технологиями являются те, которые встраивают базовые алгоритмы и непрерывные итерационные процессы машинного обучения в пакетное решение, которое позволяет бизнес-пользователям принимать надежные решения.

Вот несколько моментов, на которые стоит обратить внимание при размышлении о новых архитектурах:

МОДЕЛИРОВАНИЕ И ОПТИМИЗАЦИЯ

В технических дисциплинах, таких как науки о жизни, космические исследования, разработка продуктов и прогнозирование погоды, методы численного анализа и оптимизации, также известные как моделирование, процветали на протяжении десятилетий. Огромное количество переменных, необходимых для решения проблем в этих областях, просто превышает возможности человеческого разума. Моделирование, которое предсказывает и предписывает возможные результаты, использует лучшие из доступных на сегодняшний день вычислительных мощностей для решения сложных математических задач. Эти домены уже давно занимаются проблемами больших данных, и бизнес-лидеры могут воспользоваться их достижениями. Â Â Â

Множественные цели, переменные, взаимозависимости, ограничения и внешние влияния присущи любому процессу принятия бизнес-решений; моделирование может помочь исследовать и решить их. Интеграция функций моделирования и оптимизации в рамках модели зрелости данных компании позволяет организациям широко использовать большие данные и повышать уверенность в своих решениях.

ОБЛАЧНЫЕ ВЫЧИСЛЕНИЯ И SAAS

За последние 10–15 лет компании стали более открытыми для размещения корпоративных данных в сторонних сетях. Этот переход начался с корпоративных приложений, которые считались малоопасными для безопасности (например, CRM), но расширился и теперь включает почти все бизнес-операции, включая ERP, BI и управление цепочками поставок. Для большинства компаний отказ от собственных ИТ-активов значительно расширит возможности использования решений, аналитики, финансовой и операционной информации, а также развертывания локализованных приложений для решения сложных проблем. Эти облачные решения будут иметь такую ​​же безопасность и надежность, как и локальные решения, но с более дешевой бизнес-моделью и более простым развертыванием. Â Самое главное, облако обеспечит легкий доступ не только к программному обеспечению, но и к общим высокопроизводительным вычислительным ресурсам для передовых научных и числовых вычислений.

ЭКОНОМИКА «ПРИЛОЖЕНИЙ» И МОБИЛЬНОЕ ИСПОЛЬЗОВАНИЕ

Появление смартфонов значительно повысило личную продуктивность и расширило доступ к актуальной информации для принятия взвешенных и разумных решений. В ближайшие годы создание собственных бизнес-приложений для смартфонов, использующих корпоративные данные, коренным образом изменит то, как предприятия получают информацию и действуют в динамично меняющейся и конкурентной среде.

Если все взаимосвязано, то изменение в одном месте означает изменение везде. Экономика приложений позволяет нам быстро приспосабливаться.

[Забавное примечание: Всемирный банк открыл для общественности все свои неконфиденциальные данные. Чтобы привлечь внимание общественности к этим данным и повысить их ценность, они объявили конкурс приложений, которые объединяют несколько разрозненных источников данных для решения локальных и глобальных проблем. Соревнование было чрезвычайно успешным, и теперь эти приложения вносят долгосрочные изменения в структуры данных Всемирного банка и спасают мир.[5]]

КОНВЕРГЕНЦИЯ ОПЕРАЦИОННЫХ ДАННЫХ, БОЛЬШИХ ДАННЫХ И IIOT

Сегодня к IoT и даже к IIoT в основном относятся так, как если бы они были закрытыми системами, тогда как на самом деле они довольно открыты и включают в себя как структурированные, так и неструктурированные источники данных. К 2020 году большая часть данных останется неструктурированной. По этой причине исследования IIoT следующего поколения будут сосредоточены на поддержке принятия решений, адаптированной к конкретным отраслям. В 2011 году Watson от IBM победил в Jeopardy; В прошлом году на Go победил DeepMind от Google. Сегодня Watson работает в других отраслях (например, H&R Block), а набор инструментов машинного обучения TensorFlow от Google доступен всем бесплатно.

Вскоре ERP и IIoT будут работать вместе, чтобы расширить цепочку создания стоимости, включив в нее производителей, вероятно, с помощью датчиков. Действительно, по мере того, как разработки в области ИИ позволяют датчикам IIOT становиться более интеллектуальными, их взаимодействие станет более контекстуально насыщенным, а действия будут основываться на изменении уровней вклада датчиков. Чтобы это произошло в полной мере, системы должны перестать работать изолированно. Чтобы преодолеть пропасть и перейти к массовому внедрению в масштабах предприятия, они должны быть частью общей корпоративной аналитической платформы, в которой можно интегрировать контекст, приоритеты и предпочтения для обработки всех доступных корпоративных данных и эффективного распространения информации.

Как бизнес-лидеры выиграют конкурс больших данных

Как сегодняшние бизнес-лидеры сохранят свое конкурентное преимущество, предоставят реальные возможности принятия решений тем, кто в них нуждается, и разработают стратегическую дорожную карту, не предусматривающую вложения дополнительных средств в устаревшие приложения и системы? Задача больших данных такая же, как и всегда: извлечение полезной информации из бизнес-данных для максимизации эффективности бизнеса. Те, кто справятся с этой задачей, будут теми, кто берет пример с новаторской работы в технических дисциплинах. В ближайшем будущем пакетная обработка тысяч сценариев «что, если» за считанные минуты с мобильного устройства для прогнозирования наиболее вероятного исхода и определения наилучшего решения станет обычной практикой. Именно так компании будут решать проблему больших данных.

В то же время те, кто справится с этой задачей, будут осведомлены о связанных с этим организационных вопросах. Компании по-прежнему могут внедрять свои собственные решения AI/ML/IIoT, но для этого также требуется активное участие на стратегическом уровне. Это означает использование аналитики для решения глубоких стратегических вопросов, а не для слепого поиска закономерностей. Это означает, что аналитики должны сами выбирать архитектуру, даже если это означает большие изменения. Прежде всего, это означает, что конечным результатом являются действенные сигналы.

В сфере экономического развития существуют оценочные листы готовности сообщества к новой экономике. Это метод старой школы, но он по-прежнему сосредоточен на критических (и часто неожиданных) предикторах. Пришло время разработать оценочную карту готовности к IIoT, которая дает нам индекс, измеряющий работоспособность усилий IIoT.[6]

Персонаж Дугласа Адамса Дирк Джентли отличается. Не потому, что он может видеть, как вещи соединены, а потому, что он пытается понять, что будет связано. Урок? Сосредоточьтесь на связях и том, как они развиваются, и сопротивляйтесь построению сложных теорий, пока не получите глубокое понимание данных и того, как они взаимосвязаны.

Отличную помощь можно найти у тех, кто может предоставить человеческий опыт в предметной области, используя при этом неиспользованный потенциал больших данных и машинного обучения для определения важных ключевых показателей эффективности.

Вы, клиенты, уже перетащили вас через Рубикон. Пришло время воспользоваться этим!

#ИИ, #большие данные, #машинное обучение, #аналитика

[1] Адамс, среди прочего, написал трилогию Автостопом по Галактике.

[2] http://usblogs.pwc.com/emerging-technology/briefing-iot/

[3] Так же обычно работают организации и другие социальные структуры (например, http://bit.ly/Karen_S).

[4] Bonocore Technology Partners, KPI: умышленное снижение производительности?

[5] http://www.worldbank.org/en/news/press-release/2010/10/07/world-bank-opens-first-global-apps-for -развитие-конкурс

[6] В настоящее время я разрабатываю эту оценочную карту готовности к IIOT. Если вы хотите получить уведомление, когда он выйдет, напишите мне по адресу [email protected].