Microsoft Ignite 2023 アップデート: Age of Copilot

  • by

マイクロソフトの 2大テクノロジーイベントのひとつである Ignite 2023 が 2023/11/15-17 (シアトル、現地時間)で開催されています。
毎度ながら (Azure) AI 関連を中心にまとめてみます。(※随時更新)

AI を支えるデータセンター、インフラの増強

AI モデルのトレーニングや稼働を効率よく行うための Azure 専用チップセットが開発されており、AI モデルのトレーニングを行うための Azure Maia、ARMアーキテクチャーベースで効率的かつ経済的に AI ワークロード(推論などの処理) をおこなうための Azure Cobalt が発表されました。

また、ストレージやネットワークを目的別に特化して構築することでパフォーマンスとセキュリティを強化した Azure Boost、NVIDIA 社& AMD 社による AI 特化型ハードウエアを利用した VM (GPU) が提供されるようになります。(AMD MI300X, NVIDIA H100|H200 Tensor Core GPU)

Azure AI を活用するためのツールの統合

Azure AI Studio [preview]

Azure AI で提供されている各種 AI サービスや利用するためのツールが統合された Azure AI Studio が発表、プレビュー公開となりました。

これまで Azure OpenAI Studio, Azure Machine Learning Studio, (旧) Cognitive Services の各 Studio … と分かれていたツール群が統合され、また、データ や VM などのリソースもまとめて管理し、利用できるようになっています。

Low-code で LLM を利用できるツールとしては Copilot Studio も発表されました。

AI モデルを活用するためのサービス群

Model Catalog

これまでの Azure Machine Learning Studio でも Azure OpenAI Service で提供されている OpenAI 社のモデルだけではなく、Hugging Face や 3rd Party のモデルを利用した解析、サービスの作成が可能でした。今回の発表では、Azure AI Studio から Model Catalog としてより幅広いモデルが利用できるように統合されました。

Meta Llama2 はもちろん、Stable Diffusion や OpenAI Whisper | CLIP、軽量化モデルとして発表のあった Microsoft Research Phi なども掲載されています。

Model as a Service [Preview (announcement)]

各社の AI モデルを Model as a Service (MaaS) として利用できるようになるサービスが発表されました。OpenAI API や Azure OpenAI Service ではお馴染みの形ですが、Azure AI Studio の Model Catalog からモデルを選んで Azure 上にデプロイ、インフラを気にせずに Endpoint (RestAPI URL) とパラメーターだけで利用できるようになります。Meta Llama2、Mistral、G52 Jais などが対応予定で、Promplt Flow に取り込んで利用したり、Fine-tuning したモデルを利用したりすることも可能になります。また、Azure Content Safety を経由させることで、有害 | 不適切なコンテンツの除外なども自動化できるようになります。

Prompt Flow [GA]

Azure Machine Learning Studio で preview 提供されていた Prompt Flow が GA(一般提供) となりました。こちらは AI モデルやデータ、Python 実行モジュールなどの操作をつないだワークフローをGUIで作成、実行できるツールです。CLI (Command Line Interface) や SDK, Visual Studio Code Extention なども用意されています。

Prompt Flow にはバージョン管理、デプロイ、ワークフローの自動化、評価フロー実行などの機能が含まれており、LLM を利用したサービスの開発からデプロイに至るプロセスを自動化、管理する LLMOps を実現することが可能になりました。

Vector Search – Azure CosmosDB & Azure AI Search (旧: Azure Cognitive Search)

Azure Cognitive Search が Azure AI Search に名称変更になっていますが、Vector SearchSemantic Ranker 機能が GA(一般提供) となりました。

すでに LLMモデル + Azure AI Search の組み合わせによる RAG 構築がアーキテクチャーパターンとして公開されていますが、Semantic Ranker によって、さらに精度の高いデータ検索が可能になります。

Microsoft Fablic OneLake との連携

あらゆるデータを利用可能な形に統合する Microsoft Fablic のデータストアである OneLake と Azure Machine Learning が連携し、Fablic 内のデータを Azure Machine Learning から直接利用することが可能になります。

Azure AI Content Safety [GA]

AI モデルによる不適切なコンテンツの生成や、AIモデルへの不適切なコンテンツ投入を検出、阻止する Azure AI Content Safety が GA(一般提供) となりました。Azure OpenAI Service や Promplt Flow 利用時など Azure AI Studio から AI Content Safety を適用することが可能です。

また、マイクロソフトが提供する Copilot 製品の利用による著作権侵害のリスクに対するサポートを保証する Copilot Copylight Commitment の適用を Azure OpenAI Service にも拡大することがアナウンスされました。

最新 AI モデルの発表、提供開始

Azure OpenAI Service での OpenAI GPT-4 Turbo & GTP-4 Turbo with Vision 提供 [announcement]

今月 OpenAI 社から発表された最新の GPT モデルである GPT-4 Turbo, GPT-4 Turbo with Vision がプレビュー提供されることがアナウンスされました。”with Vision” によってマルチモーダルでの利用が可能になります。また、最新の描画用モデルである DALL·E 3 はプレビュー提供開始、GPT-3.5 Turbo 16K 1106 は2023/11末には GA となります。

Azure AI Vision Image Analysis 4.0 API、Video Retrieval、Face API with Liveness Detection

Azure AI Vision (旧: Cognitive Services for Vision) は Florence founctaion model と呼ばれている画像処理モデルを用いて、安価に画像分析(タグ付け、キャプション付け、オブジェクト検出、OCRなど)を行う機能を提供しています。

Azure AI Vision の一機能として提供されていた動画検索機能 (動画から自然言語で探したいシーンを検出) が Video Retrieval としてリフレッシュされました。Video Retrieval では動画から画像と音声を用いたインデックスを作成し、自然言語によるクエリーからのベクトル検索が可能になっています。

Azure AI Vision Face API with Liveness Detection は、生身の人間(の顔)かどうかを判別することができる機能を提供し、画像や動画などによる “なりすまし” を防止します。アプリに組み込むSDKを利用して、バイオメトリクス認証 ISO 30107-3 PAD Level 2 の機能を提供します。

Azure AI Language: Document Translation Container, Summarization & Named Entity Recognition Container

Azure AI Language ではコンテナー型 (Azure ではなく、ローカル環境の Docker コンテナーに配置できる) の発表が相次いでおり、Azure への通信が必要 (connected container) と通信不要 (disconnected container) のサービスが提供されています。

Document Translator (ドキュメントをまるっと翻訳) のほか、Summarization (要約)、Named Entity Recognition (固有表現抽出) も connected | disconnected 両方のコンテナーによるサービスが提供されます。

Azure AI Speech: Personal Voice [private preview]、Speech Avatar [preview]

音声↔テキスト変換を行うAIサービスを提供する Azure AI Speech では、個人の音声による合成音声を実現する機能として Custom Neural Voice が提供されてきました。Custom Neural Voice Lite (20~50の例文を読み上げた音声で学習させる) より進化した Personal Voice がプレビュー提供開始となりました。Personal Voice では60秒の読み上げ音声を短時間で学習させ、100以上の言語で音声合成することが可能になりました。

また、音声だけでなくアバターが話す動画を作成することができる Speech Avatar もプレビュー提供が開始されています。 話すスピードやトーンだけでなくジェスチャーも指定することが可能です。

コメントを残す

メールアドレスが公開されることはありません。 * が付いている欄は必須項目です

このサイトはスパムを低減するために Akismet を使っています。コメントデータの処理方法の詳細はこちらをご覧ください