AI(人工知能)& IoT

AI(人口知能)とIoT(モノのインターネット)について、少しずつ紹介していきます。

AIとIoTについて、ともに学びましょう。

■画像生成AI『SeaArt.AI』のサイト下記をクリックすると、画像生成AISeaArt.AI』のサイトが表示される



20240211ScreenShot00001
創作ボタンをクリックすると、次のような画面に移る。
20240211ScreenShot00002

■画像の生成

1.モデルの選択
20240211ScreenShot00003

赤で囲んだ部分をクリックすると、リストが表示される。
20240211ScreenShot00004
今回は「DreamShaper」を選択する。

2.プロンプトを入力する。

「ふり向いてイエス様を見つけ、うれしそうに微笑んだあどけない少女、リアル」
3.生成
20240211ScreenShot00011
画面上の上記のマークをクリックすると、画像の生成が開始される。
しばらくすると画像が生成される。
20240211ScreenShot00007

※生成される画像は、同じプロンプト、同じモデルでも毎回異なる。

今回は、左の画像をクリックすると、拡大表示される。

20240211ScreenShot00008
画面の右には、生成された画像の情報が表示されている。

ダウンロードをクリックすると、自分のPCに画像がダウンロードされる。

■動画の生成
20240211ScreenShot00009

右上の「動画生成」をクリックすると、次のような画面に移る。

20240211ScreenShot00010
「創作」ボタンをクリックすると、動画生成が始まる。
32cfa129502e756494ee22b8ae464718029ec7bc
ダウンロードすると、自分のPCにMP4形式で保存される。
生成された動画は、元の静止画とは趣が若干異なる。
※動画生成のプロンプトは入れられないので、どのような動画になるかは、生成されてみないとわからない。

前回投稿と同じことを、画像生成AI『DALL・E 2』を使ってやってみた。
『DALL・E 2』では、文はダメな場合が多い。単語で区切った方がいいようだ。

【マルコの福音書3章8節】
エルサレムから、イドマヤから、ヨルダンの川向こうやツロ、シドンのあたりから、大ぜいの人々が、イエスの行っておられることを聞いて、みもとにやって来た。
And many people came to Him from Jerusalem, from Idumaya, from across the Jordan, from Tullo, and from Sidon, when they heard what Jesus was doing.
20230302SS00001

「many people  Jerusalem Idumaya Jordan Tullo Sidon Jesus」
20230302SS00007

【マタイの福音書3章16節】
天が開け、神の御霊が鳩のように下って、自分の上に来られるのをご覧になった。
He saw the heavens open and the Spirit of God descending like a dove and coming upon him.
20230302SS00002

【ルカの福音書1章47節】
わが霊は、わが救い主なる神を喜びたたえます。
My spirit rejoices in God my Savior.
20230302SS00003

「spirit rejoices God」
20230302SS00004

英訳は前回同様に『DeepL』を使用した。

聖書の聖句を英訳して、話題の画像生成AI『Midjourney』にインプットして、画像を作ってみた。

【マルコの福音書3章8節】
エルサレムから、イドマヤから、ヨルダンの川向こうやツロ、シドンのあたりから、大ぜいの人々が、イエスの行っておられることを聞いて、みもとにやって来た。
And many people came to Him from Jerusalem, from Idumaya, from across the Jordan, from Tullo, and from Sidon, when they heard what Jesus was doing.

many


【マタイの福音書3章16節】
天が開け、神の御霊が鳩のように下って、自分の上に来られるのをご覧になった。
He saw the heavens open and the Spirit of God descending like a dove and coming upon him.

heavens_open


【ルカの福音書1章47節】
わが霊は、わが救い主なる神を喜びたたえます。
My spirit rejoices in God my Savior.


spirit_rejoices

ちなみに英訳には、『DeepL』を使っている。

 GPUの高性能化の恩恵もあり、俗に「ゲーミングパソコン」と呼ばれるものでも、AIの学習をさせることはできるが、AWS(Amazon Web Services)、Microsoft Azure、Google Cloud(GCP)、IBM Cloudなど、クラウド上のAIサービス用いることが多い。

【クラウドAI】
 クラウドサーバー側でデータの学習と予測を行い、末端のエッジデバイスとの間で通信を行うという仕組みで、クラウド側で処理を行う仕組みから、「クラウドAI」と呼ばれる。
cloud-ai

 この仕組みにおいては、クラウドサーバーの豊富なコンピュータリソースを用いることができるが、AIによる予測を行った後のプロセスで通信が発生するため、この際の通信遅れが致命的な問題になるようなリアルタイム性が求められる場面、例えば最近注目されている自動運転などでは使うことができない。

 とはいえクラウドであれば大量のデータ処理が可能であるため、通信が遅れても問題が生じない用途においては、非常に表現力の高いAIアルゴリズムであるディープラーニングなどは適している。

【エッジAI】
 クラウド側で行っていた予測をエッジデバイス側で行うようにしたAIを、「エッジAI」と呼ぶ。
edge-ai

 この仕組みにおいては、クラウド側のAIで学習した結果として生成される学習モデルをエッジ側に置くことにより、予測のみをエッジ側で処理する。

 予測をエッジ側で行うことにより、従来のAIにおける通信遅れなどの問題を解消することができる。例えばAIを機械の制御に用いるケースにおいては、予測をエッジ側で行うことができれば、予測から制御のプロセスにおいては通信が介在しないため、通信遅れが問題になることがない。

 より末端の機器(エンドポイント)側でデータ処理を行い、産業用機械や自動運転車などに必要とされるリアルタイム性を確保することができるが、クラウド側でデータの学習を行うため、セキュリティ上の問題でクラウドにデータを上げたくないといったニーズに対しては課題が残る。

 またデータの学習を行ってから学習モデルをエッジ側に生成する際には通信が必要とされるため、学習から予測までを完結してリアルタイムに行うことはできない。

【学習も予測も行うエッジAI】
 更なるハードとソフトの進展により、エッジデバイス側で予測だけではなく学習まで行うことができるエッジAIが出てくるであろう。
aising-edge-ai


出典(引用)
AISing:"エッジAI"とは?https://aising.jp/what-is-edge-ai/

 「半教師あり学習(Semi-Supervised Learning)」とは、「教師あり学習(Supervised Learning)」「教師なし学習(Unsupervised Learning)」の中間的な学習方法。

教師あり学習(Supervised Learning)
 「教師あり学習」は、学習データにおいてすべてラベルが付いている状態。

教師あり学習


 「教師あり学習」ではラベル付きデータのみを用いて学習を行うが、ラベル付きデータは大量に用意するのは困難であるとされる。一方でラベルなしデータは比較的簡単に手に入れることができる。学習データにおいてラベルが付いていない状態で学習をすることを「教師なし学習」いう。

半教師あり学習(Semi-Supervised Learning)
 「半教師あり学習」は、学習データにおいてラベルが付いているものと付いていないものが混在している状態で学習をすること。

半教師あり学習


 「半教師あり学習」では、少数のラベル付きデータと多数のラベルなしデータを用いることで、よい分類器を比較的簡単に作ることができる。

半教師あり学習の分類
 「半教師あり学習」は大きく分けて

・半教師あり分類学習
・半教師ありクラスタリング

 の2種類がある。

 「半教師あり分類学習」は、教師あり学習を拡張したもので学習データに必要となるラベルが一部にのみ付加されたもので学習をし、アノテーションにかかるコスト削減を目指す。

 対して「半教師ありクラスタリング」は、一部のデータ間にそれらが同じクラスタに属するかどうかの情報が付加されたもので学習をし、精度向上を目指す。

半教師あり分類学習の手法を実現する方法
また、「半教師あり分類学習の手法を実現する方法」として、下記のような手法が存在する。

・自己訓練 (Self-Training)
・半教師あり混合ガウスモデル (semi-supervised Gaussian mixture models)
・共訓練 (Co-Training)
・グラフベース半教師あり学習 (Graph-based Semi-Supervised Learning)
・S3VM(Semi-Supervised Support Vector Machine)
・PNU Learning

 「PNU Learning」を除いてはそれぞれ「モデル仮定」と呼ばれる仮定が必要。
 「モデル仮定」とはラベル無しデータを学習に利用するためのデータに対する仮定であり、生成される分類器に対して大きな影響を与えて、真の仮定と大きく異なる仮定を採用した場合、理想とは大きく異なる学習をすることが考えられる。「PNU Learning」は、「モデル仮定を必要としない半教師あり分類学習の手法」として注目を集めている。


[出典]
画像処理語らいブログ:半教師学習と弱教師学習の違い

The 16th Game Programming Workshop 2011:自己対戦棋譜を利用した半教師あり学習による将棋の評価関数の学習/林 伸也、浦 晃、三輪誠、田浦 健次朗、近山隆

Qiita:半教師あり学習のこれまでとこれから

 ニュースサイト・CyberNewsのセキュリティ研究者であるMantas Sasnauskas氏と研究者のJames Clee氏・Roni Carta氏の共同研究により、中国製の安価なルーターに不審なバックドアが存在していることが判明した。

バックドアルーター


 バックドアの存在が指摘されているのは、ウォルマートが独占販売している「Jetstream」ブランドのルーター、およびAmazonやeBayで販売されている「Wavlink」ブランドのルーター。

 Amazonで「Wavlink」ブランドのルーターを購入したところバックドアが存在したため、同じファームウェアを使っているルーターには同様の穴が存在するのではないかと疑って調査範囲を広げたところ、「Jetstream」ブランドのルーターでバックドアが見つかったとのこと。

 最大で年間1200万台から2400万台のバックドアつきルーターが世界に出回っているとのこと。

 もしJetstreamおよびWavlinkのルーターを使用している場合、ただちに使用を中止し、評判のいいメーカーのルーターに交換するのが最善である。また、該当するルーターを使い続けるかどうかに関わらず、ネット接続を一時的に切断した上で、接続していた端末に対してウイルススキャンを行うなどして、ログイン用パスワードやネットサービスに利用しているパスワードなどを変更した方がいいと助言している。


【バックドア(backdoor)】
  バックドアとは、悪意あるハッカーがセキュリティホールを見つけ侵入し、次回から容易に侵入することができるように設置する裏口のこと。


【出典】
中国製の安価なルーターに不審なバックドアが存在、積極的に悪用しようとする試みも - GIGAZINE

Spatial(スペイシャル)は、異なるデバイス間(クロスデバイス)でコミュニケーションが取れるコラボレーションプラットフォーム。異なる場所にいる複数のユーザーが、デバイスを問わず同じVR/AR空間を共有できるプラットフォーム。複数人のユーザーが、ビデオやアバターを通じて同じ空間でコミュニケーションを取れる。

『ホログラフィックミーティング』


最大で25~30人のユーザーが、ビデオやアバターを通じて同じ空間でコミュニケーションを行う『ホログラフィックミーティング』が可能。3Dオブジェクトの操作や、バーチャルペンで空間に文字を書くといった動作も可能だ。

VR/ARヘッドセットの着用者は、実際の腕の動きを再現するために手/コントローラーの追跡を使用して、リアルな胴体アップ3Dアバターとして描かれ、集合的な存在感は2Dビデオチャットと比較して劇的に高まり、ユーザーは空間内の複雑な3Dオブジェクト、ドキュメント、Webページ、およびビデオを共有および移動できる。

対応する機器は、マイクロソフト「HoloLens」やMagic Leap「Magic Leap 1」といったMRデバイス、そして一体型VRヘッドセット「Oculus Quest」、タブレット端末やデスクトップPC等多岐にわたる。ARヘッドセット等がまだ高価で普及途上の中、スマートフォンを含む様々なデバイス間で利用できる点は、大きなメリットと言える。

Oculus Quest 2
       VRヘッドセット Oculus Quest 2

新型コロナウイルスの影響で、一つの会場に多くの人が集まることができない状況の中、「Spatial」の無償化、参加人数の拡大の効果も含め、サイバー空間での集まりは拡大していくであろう。

VRヘッドセットはまだまだ付けている感が強すぎるが、スマートグラスの更なる小型化、高性能化が進めば、装着を意識することなく、フィジカル空間からサイバー空間へのワープが可能になるだろう。


【出典】
moguraVR News:バーチャル空間を共有できるSpatialが無償化、“在宅勤務疲れ”対策に商機

 商用サービスが始まった5Gの真価を発揮するカギとなるのは、「5G SA方式」「ネットワークスライシング」と言われている。

【5G SA(Standalone/スタンドアローン)方式】
 既存の4Gネットワークを活かしながら、部分的に5Gを導入していく方式を「5G NSA(Non-Standalone/ノンスタンドアローン)方式」という。

 一方、4Gのコアネットワークから独立した4Gのコアネットワークによる5Gの基地局を単独で動作させる方式を「5G SA(Standalone/スタンドアローン)方式」という。

現在の「4Gコアネットワーク」から「4G NSA」を経て、「4G SA」へ移行していくとされるが、今しばらく時間がかかると言われている。

5GSA
(新世代モバイル通信システム委員会報告概要資料より)

【ネットワークスライシング(Network Slicing)】
 「ネットワークスライシング」とは、仮想的にネットワークを分割し、複数の通信を同時にエンド・ツー・エンドで実現すること。

 ネットワークスライシングでは、5Gの特徴である「高速大容量(eMBB)」「超高信頼・低遅延(URLLC)」「多数同時接続(mMTC)」を活かすために、用途に応じて、データを送る単位を変える。

 たとえば、低遅延が望まれる用途では、一度に送るデータのサイズを極力小さくする「超低遅延スライス」を使う。データの送信開始時から完了までの時間は短くすることで機械にデータが届くまでの遅延を少なくする。

 逆に、8K映像伝送用などには、一度に送るデータの帯域を大きく取り、大容量のデータ伝送する「高速大容量スライス」を使う。

 また、超多数のデバイスを収容しながら、ある程度の低遅延通信が可能なようにURLLCとmMTCの中間的な性能を持つスライスを使うといったケースも出てくると考えられる。

 LTEをアンカーバンドとする「5G NSA」では、ネットワークスライシングは実現できない。RAN(無線アクセスネットワーク)からコアネットワーク、トランスポートまで含めたエンドツーエンドのネットワークスライスを作るには、「5G SA」の導入が必須。

 国内携帯キャリアは2021年半ば以降に「5G SA」を導入する見通しであり、ネットワークスライシングを提供するのは、早くとも2023年頃、一部のユーザーや地域に限定して先行的に提供する場合でも、2021年からスタートすると見られている。


【出典】
ケータイ用語の基礎知識「第857回:ネットワークスライシングとは」

企業ネットワーク最前線「5Gスタート後の“最初の関門”SAとネットワークスライシングの導入シナリオ」https://businessnetwork.jp/Detail/tabid/65/artid/7449/Default.aspx

新型コロナウイルス感染症(COVID-19)対策として、在宅勤務を継続する企業も多く、Web会議ツールは在宅勤務において重要な役割を果たす。

一方、Web会議ツールはサイバー攻撃の標的にもなりやすい。ソフトウェアの脆弱(ぜいじゃく)性を悪用したリモートでのマルウェア実行、Webカメラの遠隔操作による盗撮、サーバなどのリソースに負荷をかけてサービス停止を狙うDoS(サービス拒否)攻撃への対策は不可欠。

1.会議の開始タイミングを制御する
 ホストが正式に会議を開始するまで始められないようにすることで、不正な参加者が入ってくるのを防ぐ。

2.同じミーティングIDを使い回さない
 会議IDを不正に入手して会議に乱入し、嫌がらせ行為をする「ボンバー」(爆撃者)または「スクワッター」(不法占拠者)と呼ばれる攻撃者が存在する。

3.パスワードを設定する
 会議ごとに個別のミーティングIDを使うだけでなく、パスワードによる認証は、物理的な会議室に入ってくる出席者の顔を確認するのと同じ。

4.ミーティングルームに鍵をかける
 参加者全員がバーチャル会議室に入室したら仮想的な“鍵”を掛ける機能を持つWeb会議ツールもある。この機能は不正な参加者の乱入を防ぐのに役立つ。

5.会議の録画を参加者に通知する
 録画機能を備えるWeb会議ツールで会議を録画する際は、プライバシー保護の観点から参加者にそのことを通知する必要がある。

6.バーチャル背景を利用する
 「Zoom」のバーチャル背景機能や、「Microsoft Teams」の背景をぼかす機能を活用すれば、参加者はうっかり何かが映ってしまうことや室内の状態を気にせずに会議に集中できる。無料のバーチャル背景もたくさんあり、背景を変えることで、会議の活性化につながるとの声もある。

7.チャット機能に注意する
 チャットでは機密情報や社外秘ファイルをやりとりしないよう、注意を促すことが必要。マルウェア防止機能がWeb会議ツールにない場合がある点にも注意。

8.Web会議ツールのアップデートを怠らない
 悪意ある攻撃者や善意のハッカーがこうしたツールを狙うようになれば、重大な欠陥を修正するアップデートも頻繁に公開されるようになる。Web会議アプリケーションをインストールした全てのデバイスについて、アプリケーションを常に最新の状態に保つ必要がある。


【出典】
TechTargetジャパン:バーチャル背景だけじゃない Web会議のプライバシーとセキュリティ8大保護策 https://techtarget.itmedia.co.jp/tt/news/2006/08/news07.html

 2020年6月10日、NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)は人工知能(AI)技術の社会実装を進めるプロジェクト「次世代人工知能・ロボットの中核となるインテグレート技術開発」において、機械学習の自動化などの開発期間の短縮と、容易な利用・導入を可能にするプラットフォームを構築することを目的に、新たに3件の研究開発テーマを採択したことを発表。早期の社会実装とグローバル市場への展開を視野に入れて、アジャイル型の開発手法で研究開発を進めていくとしている。

■研究開発プロジェクトの概要
事業名:次世代人工知能・ロボットの中核となるインテグレート技術開発
実施期間:2018年度~2023年度(予定)
予算:17億円(2020年度)
研究開発項目1:「人工知能技術の社会実装に向けた研究開発・実証」
研究開発項目2:「人工知能技術の適用領域を広げる研究開発」
研究開発項目2-1:「人工知能技術の導入加速化技術」
研究開発項目2-2:「仮説生成支援を行う人工知能技術」
研究開発項目2-3:「作業判断支援を行う人工知能技術」
(i)設計における問題点・改善点を自動的に指摘する人工知能技術の開発
(ii)製造における非熟練者の判断を支援する人工知能技術の開発

nedoai01


今年度は、研究開発項目2-1、2-3(ii)について公募・採択。

【テーマ①】
『自動機械学習による人工知能技術の導入加速に関する研究開発』
 ハイパーパラメーター最適化、ニューラルアーキテクチャーサーチ、転移学習を融合し、多目的最適化に拡張することでさまざまな産業用途に合わせたネットワークモデルを自動的に速く構築することを目指した研究開発。

nedoai02


【テーマ②】
『オンサイト・ティーチングに基づく認識動作AIの簡易導入システム』
 AI導入作業の簡潔化を目的とし、そこに含まれる繰り返し単純作業を知能ロボットにより代替するシステムの開発を目指す。認識動作の知能モジュールにより、人と同様に視覚、双腕、ハンドを有するロボットが、人がその場で見せた対象物と、それに対する動作を基本情報として蓄積し、自ら試行錯誤を繰り返す中で適切なAIソリューションの選択やデータアノテーション※5、ハイパーパラメーターの探索を行う。

nedoai03


テーマ③】
『最適な加工システムを構築するサイバーカットシステムを搭載した次世代研削盤の開発』
 暗黙知とされる熟練者思考をグラフデータ化して最適な加工システムを導出し、熟練者の感覚をセンサーが捉えるマシンの挙動と加工変化に置き換えて数値化することで、加工最適化を行えるAI技術を搭載した複数種類の研削盤を開発する。

nedoai04


【アジャイル】
 反復(イテレーション)と呼ばれる短い開発期間単位での開発を採用し、その開発期間単位を繰り返して、完成度を高めていく開発手法。順次、機能確認しながら開発を進めることで、リスクを最小化しようとする開発手法の一つ。

【ハイパーパラメーター】
 ディープラーニングにおいて、人間が最初に設定しなければならない重みの初期値や学習率といったパラメーターで、現状は試行錯誤で決定している。

【ニューラルアーキテクチャーサーチ】
 深層学習モデル(ニューラルネットワーク)のネットワーク構造を自動的に生成する技術。

【転移学習】
 ある領域で学習したこと(学習済みモデル)を別の領域に役立たせ、効率的に学習させる技術。

【アノテーション】
 あるデータに対して関連する情報(メタデータ)を注釈として付与すること。AI技術では、ディープラーニングを活用するための運用工程の一つであり、取得した大量のデータを識別および分類し、教師データ(正解データ)を作成する機能。



出典
NEDO(国立研究開発法人新エネルギー・産業技術総合開発機構)ニュース

↑このページのトップヘ