NEWS TOPICS

会員向け情報はこちら

第1回 新しいISO/IEC規格により、業界全体でビッグデータの採用が可能に

ビッグデータの国際規格 ISO/IEC 20547シリーズについて

第1回
新しいISO/IEC規格により、業界全体でビッグデータの採用が可能に

 人工知能の国際規格を策定するIECとISOの合同技術委員会(ISO/IEC JTC1/SC42)は、ビッグデータに関する一連の規格の第3部を公表しました。
 「ISO/IEC 20547-3:2020 情報技術-ビッグデータ・リファレンス アーキテクチャ-第3部:リファレンスアーキテクチャ」の主な目的は、現在のアーキテクチャと将来の方向性について、複数の製品、組織、分野間での共通理解を促進することです。

 SC42の議長であるWael William Diab氏は"洞察とアナリティクスが促進するデジタルトランスフォーメーションの世界では、データエコシステムが最も重要です"と述べています。"ビッグデータは、処理されるデータの特性を考慮することで、アプリケーション領域のニーズに効率的に対応するために、ITシステムに革命をもたらします。ビッグデータ・リファレンス・アーキテクチャ(BDRA)の国際規格とそのシリーズ規格は、様々なステークホルダーのためのアーキテクチャの枠組みと共通言語を提供することで、この可能性のある技術の採用を加速させるでしょう。"

データの世界に生きる

 検索統計によると、平均して毎秒40,000件の検索クエリがあり、1日あたり35億回以上、年間1兆2,000億回以上の検索が世界中で行われていることになります。
 また、Statista社によると、現在35億人のスマートフォンユーザーがメッセージを送信したり、ビデオや写真のコンテンツをアップロードしたり、データを作成する携帯電話アプリを使用しているそうです。

 IDCのレポートによると、ビッグデータとアナリティクス(BDA)ソリューションは、2022年までに2,743億米ドルに達すると予想されています。
 レポートでは、銀行、個別製造業、専門サービス、プロセス製造業、連邦/中央政府が現在、BDAソリューションへの最大の投資を行っていると指摘しています。
 ビッグデータ分析に利点がある半面、データの品質と管理、データの生成、使用、保存、保護の方法について懸念があります。

 この規格は、ビッグデータのコンポーネント、プロセス、システムを記述するためのアーキテクチャ枠組みを開発者に提供し、ビッグデータ・リファレンスアーキテクチャ(BDRA)と名付けられた様々なステークホルダーのための共通言語を確立するのに役立ちます。
 これは、ビッグデータに固有の要件、構造、操作を網羅するであろうリファレンスアーキテクチャ枠組みを用いて、システム固有のアーキテクチャを記述し、議論し、開発するためのツールです。

 BDRA規格のプロジェクト・エディターであるRay Walshe氏は"新興技術の標準化政策とガバナンスは、欧州委員会、国連、世界経済フォーラムにおいて優先度が高く置かれています。ISO/IEC 20547-3ビッグデータ・リファレンスアーキテクチャは、ビッグデータシステムにおけるビッグデータのユーザー、消費者、生成者、管理者、インテグレータにガイダンスを提供します。BDRAのような規格は、将来の認証、規制、法律を構築するための基礎となるものです"と述べています。

ビッグデータエコシステムへの対応

 規格では、2つのビューを定義することで、ビッグデータのエコシステムを記述しています。
 それぞれの視点は、そのステークホルダーグループの視点からシステムを見て、彼らの懸念事項に対処するためのアーキテクチャを詳細に記述します。具体的には:
   ◎ユーザービュー - ビッグデータエコシステム内の当事者、役割/サブロール、その関係、活動の種類、横断的な側面を定義。
   ◎機能ビュー - ユーザービュー内の役割/サブロールの活動を実装するアーキテクチャ層とその層内の機能コンポーネントのクラスを定義。

  上記の2つのビューから、開発者は下記と共にミッションクリティカルな機能性を実行するための具体的な実装アプローチと展開戦略を選択することができます:
  ◎実装 - サービスパーツやインフラパーツ内でのビッグデータの実装に必要な機能の網羅。
  ◎配置 - ビッグデータの機能が、既存のインフラストラクチャの要素の中で技術的にどのように実装されているか、またはこのインフラストラクチャに導入される新しい要素の中でどのように実装されているかの説明。

データの安全性とプライバシーの確保

  友人にメールを送ったり、製品を購入したり、請求書を支払ったり、オンライン予約をしたりする際には、あらゆる種類の個人データが生成されます。
  さらに、私たちに関するデータは、デジタル医療ファイルのように生成・保存され、異なる医療専門家によって共有されることもあります。
 すべての私たちのデータが安全でプライベートなものであることが重要です。

 規格では、データに関連した3つの重要で横断的な側面に注目しています。
  ◎セキュリティとプライバシー:システムとデータの機密性、完全性、リスクからの可用性を維持し、個人を特定できる情報(PII)を不正使用からどのように保護するかに関するもの。
  ◎管理:システムコンポーネントとリソースのプロビジョニング、設定、利用、監視の方法に関するもの。
  ◎データガバナンス:データがシステム内でどのように管理され、ライフサイクルにわたって管理されているかを網羅するもの。

ビッグデータの提供者と消費者

  ビッグデータのエコシステムは膨大で、ビッグデータを利用する活動、ビッグデータ分析サービスを提供する活動、データを提供する活動の3つのグループに分けることができます。

  ビッグデータに関するSC42 Working Group 2の招集者であるWo Chang氏は"目標は、あらゆるステークホルダー(データ科学者、研究者など)が、基礎となるコンピューティング環境を気にすることなく、与えられたデータソースに対して分析処理を実行できるようにするために、ベンダーニュートラルで、技術やインフラストラクチャにとらわれない安全な参照アーキテクチャを提供することです。"と述べています。

ビッグデータアナリティクスのライフサイクルに焦点を当てる

  この規格には、ビッグデータに関連する一般的な役割とサブロールのいくつかの記述が含まれています。

  主な考え方は、ビッグデータサービスパートナー(BDSP)が、ビッグデータプロバイダー(BDP)から1つ以上のデータセットを持ち込んで、ビッグデータアプリケーションプロバイダー(BDAP)のアナリティクスライフサイクルに焦点を当てる方法をオーケストレーションできるようにすることです。
  これは、ビッグデータフレームワークプロバイダ(BDFP)から基礎となるコンピューティング環境を気にすることなく、データ収集からデータ準備、データ分析、データ可視化までの各サブロールの1つ以上の段階をインスタンス化することで実現されます。
  BDFPが改良・強化を続けているため、BDAPアナリティクスツールや分析のための再ツール化の必要はありません。

  Chang氏は、"このBRDAのアプローチを利用することの素晴らしさは、統計解析や分類、AIの機械学習とディープラーニングアナリティクスなどの従来のアナリティクスをBDASがどのようにサポートできるかを探る次のステップとして、BDAPをサービスとしてのビッグデータ(BDAS)に変換できることです。"と述べています。

  AIは、コンピュータビジョン、音声認識、自然言語処理から、新興技術 (例:自動運転車、創薬や毒物学、金融詐欺検出) などの実用的なさまざまな問題を解決することで、機械学習やディープラーニングの能力を発揮してきました。
  AIアルゴリズムの進歩するにつれ、多くの産業がこれらの技術の恩恵を享受しています:顧客のレコメンデーションは消費者のパターンを求め、小売業者は広告で拡張現実(AR)や仮想現実(VR)の機能を使用し、手術現場や、ホテルや観光業などのホスピタリティ産業では、アシスタントロボットを使用しています。
  トレーニング目的でのAIの良質なデータへの依存は、そのようなデータ品質を提供する手段を持つビッグデータと一致します。
  これは、AIの消費のための統合されたデータソースを作成するために、複数のデータソースからの多様なデータを扱う場合に特に当てはまります。
  SC42は、将来のAIアナリティクスやシステムのニーズをサポートするために、サービスとして拡張可能なアナリティクスを可能にするAIと、ビッグデータ標準規格のポートフォリオを用い、その両面で継続的な規格開発をしています。

ビッグデータシリーズ規格の詳細

  ISO/IEC 20547シリーズは、ビッグデータアーキテクチャの開発と実装のための標準化されたアプローチを提供し、アプローチのための参考情報を提供しています。
 ISO/IEC TR 20547-1では、リファレンスアーキテクチャ枠組みの概要と、ビッグデータアプリケーションの開発においてその枠組みを適用するためのプロセスが示されています。
 ISO/IEC TR 20547-2では、ビッグデータのユースケース集を提供し、ビッグデータ・リファレンスアーキテクチャ開発のための技術的な考慮事項に分解しています。
 ISO/IEC 20547-4では、ビッグデータに特有のセキュリティとプライバシーの側面について述べています。
 ISO/IEC TR 20547-5では、アーキテクトや実装者がシステムの設計や実装の一部として考慮することができる規格の一覧とリファレンスアーキテクチャとの関係を提供しています。

さらに、ISO/IEC 20546はビッグデータを構成するものに対する共通理解を確立するための用語と定義のセットで、ビッグデータの分野の概念的な概要を提供しています。

本記事は“IEC e-tech” の記事より。