機械学習と AI を始める方法

マット・フォード - 2022 年 6 月 22 日午後 1 時 (UTC)

1950 年代、現在人工知能と呼ばれているものの初期の頃、この分野の名前をどうするかという議論がありました。論理理論マシンと一般問題ソルバーの両方の共同開発者であるハーバート・サイモンは、この分野には「複雑な情報処理」というもっと奇妙な名前が付けられるべきだと主張した。これは確かに「人工知能」のような畏怖の念を刺激するものではありませんし、機械が人間のように考えることができるという考えを伝えるものでもありません。

ただし、人工知能が実際に何であるかを表すには、「複雑な情報処理」という方がはるかに適切です。つまり、複雑なデータセットを解析し、その積み重ねから推論を試みることです。 AI の最新の例には、音声認識 (Siri や Alexa などの仮想アシスタントの形式) や、写真に写っているものを判断したり、次に何を買うか、何を観るべきかを推奨するシステムが含まれます。これらの例はいずれも人間の知能に匹敵するものではありませんが、十分な情報処理があれば、私たちが驚くべきことを実行できることを示しています。

この分野を「複雑な情報処理」と呼ぶか、「人工知能」（あるいはスカイネットのような不気味な響きの「機械学習」）と呼ぶかどうかは関係ありません。非常に素晴らしいアプリケーションを構築するために、膨大な量の作業と人間の創意工夫が費やされました。例として、GPT-3 を見てみましょう。GPT-3 は自然言語の深層学習モデルで、人間が書いたテキストと区別できないテキストを生成できます (ただし、驚くほど間違っている可能性もあります)。これは、1,700 億を超えるパラメーターを使用して人間の言語をモデル化するニューラルネットワークモデルによって支えられています。

GPT-3 の上に構築されているのは Dall-E という名前のツールで、ユーザーが要求したあらゆる空想的なものの画像を生成します。このツールの更新された 2022 バージョンである Dall-E 2 では、非常に抽象的なスタイルや概念を「理解」できるため、さらに進化することができます。たとえば、Dall-E に「アンディウォーホルのスタイルで馬に乗っている宇宙飛行士」を視覚化するように依頼すると、次のような多数の画像が生成されます。

Dall-E 2 は、類似した画像を見つけるために Google 検索を実行しません。内部モデルに基づいて画像を作成します。これは数学のみから構築された新しいイメージです。

AI のアプリケーションのすべてがこれほど革新的であるわけではありません。 AI と機械学習は、ほぼすべての業界で活用されています。機械学習は多くの業界で急速に必須の存在となり、小売業界の推奨エンジンから石油・ガス業界のパイプラインの安全性、医療業界の診断と患者のプライバシーに至るまで、あらゆるものを強化しています。すべての企業が Dall-E のようなツールをゼロから作成するリソースを持っているわけではないため、手頃な価格で入手可能なツールセットに対する需要が多くあります。この需要を満たすという課題は、コンピュータとコンピュータプログラムが急速にビジネスに必要なテクノロジになりつつあったビジネスコンピューティングの初期の時代と似ています。誰もが次のプログラミング言語やオペレーティングシステムを開発する必要があるわけではありませんが、多くの企業はこれらの新しい研究分野の力を活用したいと考えており、それを支援する同様のツールを必要としています。

ブログ