業界情報 シリーズ①トレンド LLM(ChatGPT)
今回は最近「急上昇」のトレンドです。わたしもほんと最近「ChatGPT」をよくみるようになりました。最近ラジオで聞いたアンケート結果では世間の課長さんは認知30%肯定30%程度のようです。しかし、昨日某社社長と昼食をご一緒した際に、スマホ上でChatGPTが東大の入試問題を解いたのを見て驚きました。以下いつも通りの纏めですが、最後わたしがChatGPTに株価算定について聞いた結果を掲載します。

大規模言語モデルを用いたテキスト生成AIの進化、デスクワーク全般に大きな変化の兆し
データから学習し、オリジナルのテキストや画像を生み出す自動生成AI(Generative AI)が、急速に発展しています。
特にテキスト生成では、OpenAI(USA)が2022年11月に公開したChatGPTが、問いかけに対する受け答えの自然さと、知りたい情報を直接回答する利便性で話題となり、わずか2か月で1億ユーザに到達しました。

ChatGPTの登場で、ビッグテック各社も、これまでは研究開発段階だった技術やサービスを、ユーザへのベータ版提供を急に始めるなど、動きが慌ただしいようです。
背景には、後述する大規模言語モデル(LLM:Large Language Model)と呼ばれる、大量のデータで学習した汎用的なAIモデルの実現があるようです。

LLMは、大量のテキストデータで学習した汎用的なAIモデル
テキスト生成AIを含む自動生成AIは、LLMの誕生で爆発的に進化しているようです。
AI関連技術は、特にディープラーニングの誕生で、2010年代に大きく進化しそして、2017年にGoogle(USA)の研究チームが「Attention is All You Need」という論文で、Self-Attention(自己注意機構)を持つTransformerという手法を発表しました。この手法は、これまで使われていたRNN(回帰型ニューラルネットワーク)より学習効率が圧倒的に高く、大量のデータを学習できるようになったといわれています。
学習量の増加は、AIの能力を測る指標の一つであるパラメータ数の指数関数的増加をもたらしたといわれます。
実際に、GPT-1は1億、GPT-2は15億、GPT-3は1,750億(変数)とパラメータ数が急増しているようです。また先日発表されたGPT-4は、公式発表はされていないのですが100兆パラメータとも噂されているとのことです。

このように大量のデータを学習できるようになったことで、用途を特定しない機械学習(事前学習)が十分にできるようになり、汎用的な能力をもつLLMが萌芽したようです。

そしてLLMは、少量のデータを用いた微調整(ファインチューニング)により、特定用途に最適化することもできるのだそうです。
例えば、ChatGPTはLLMであるGPT-3(GPT-3.5)に、人間が教師データ(ラベル)をつけることでファインチューニングした後に、無害で有用な情報を人間が好む形で出力するように人間のフィードバックに基づいた最適化(RLHF:Reinforcement Learning from Human Feedback)をしているのだそうです。
自然言語での指示と対応できるタスクの幅広さで、デスクワーク全般を支援可能に
テキスト生成AIは、仕事の指示方法と、対応できるタスクの幅広さの2点で、従来のAIよりできることが増えているようです。
まず、複数のタスクを組み合わせた仕事の指示が、人間同士でコミュニケーションするような普通の文章(自然言語)でできるようになりました。

これまでは、例えばGoogleでキーワード検索を行い、さらには内容を確認して人間がまとめたり、まとめるサービスを使ったり、というように順番に個別に行う必要があったのですが、それが、例えば最新のBingなどのテキスト生成AIを使った会話型検索では、調査テーマを入力しまとめ方の指示をすれば、要約までやってくれるようです!
少ない指示で工程の多くをできることから、効率が大きく改善するようです。
そして、LLMによって汎用的な能力・知識を獲得しているため、追加的な開発をせずとも対応できるタスクの種類がそもそも幅広いため、多くのデスクワークは何らかのテキストを使った業務であり、それに幅広く対応できるようです。

なお、テキスト生成AIによるアシストは、人間が行ってきた仕事を完全に代替するのではなく、その作業の一部を補佐・代行するものであるため、Copilot(副操縦士)とも呼ばれているのだそうです。
自動生成AI市場は2022-30年にCAGR35%で成長見込み、さらなる期待も
テキスト生成AIを含む自動生成AI全体の市場規模は、Grand View Researchが2023年1月に発表した調査では2021年で80億ドル、2030年には1,094億ドルとなりCAGR約35%で成長すると予想しています。

2021年時点の技術別の内訳では、テキスト生成AIを含むTransformerセグメントが最大の収益シェアを占めており、用途別では、メディアとエンターティメントが最も収益が大きく、特に広告作成への採用増加にともない今後も成長が見込まれています。
ただし、ChatGPTが発表されたのは2022年11月末です。その後、ChatGPTを応用した新しいサービスやアイデア、ChatGPT自体のAPIでの提供やGPT-4の発表、ビッグテック各社の急速な注力など、環境は大きく変化しています。
実際に、Googleは自社検索サービスの根幹を脅かす可能性があるとして経営として社内に警戒を呼びかける「Code Red」を発動しました。現在の期待値は、この調査よりも高い可能性もあるでしょう。
プログラム用途では開発時間が半分以下、広告用途では3割削減を目指す事例も
プログラミングの編集・記述支援サービスである「GitHub Copilot」では、プログラム作成にかかる時間が55%短縮されたとの調査結果が出ています。
プログラミングは、日常生活にインターネットが溶け込み、世界がデジタル化する中で、雇用含めたニーズが広がっている領域です。それゆえ雇用需給もタイトであり、人件費も高騰しています。その対応として、雇用を増やさずにプログラミングの生産性を上げられれば、十分な費用対効果につながる可能性があるようです。
また、サイバーエージェントはChatGPTを活用してデジタル広告のオペレーションにかかる時間の3割減(約7万時間削減)を目指すと2023年4月に発表しています。

先進国では特にデスクワーク中心の業務の従事者が多いです。実際に労働力統計(2021年)によると、日米ともに労働者の6割前後が管理職や専門職、事務職などデスクワーク中心の職業についています。デスクワークは、なんらかのテキスト入力を伴う業務が多く、潜在的な市場規模も大きいと考えられます。
OpenAIとペンシルべニア大学の調査では、GPTの導入により米国労働者の約80%が少なくとも10%の仕事内容に影響を受けるとされています。
インターネットやメール、Web会議の登場によって働き方が変わったように、活用によって働き方や生産性も変わっていく可能性が高いだろうとかんがえられています。
テキスト生成AIに関する企業・サービスは、LLM自体の開発とそれを用いたサービスの階層で捉える
LLMやテキスト生成AIに関わる企業やサービスは、開発観点と利用観点で分けて構造を捕らえていくと分かりやすいようです。

まずLLM自体の開発があります。これらは、ビッグテック各社が自社で取り組んだり出資をしたりしながら進めていることが多いようです。OpenAIは、Microsoftから2019年以降、数十億ドルの投資を受けて提携しています。
ちなみに、BingAIで今日の山登りの服装を聞いてみました。

まだ肌寒いということですが、どうでしょうかね。
(続き)Googleは自社で多くのLLMを開発しているほか、子会社にDeepMind(GBR)を持ち、また、GPT-3を開発したメンバーらが創業したAnthropic(USA)にも出資しています。
2023年2月にはAmazon.com(USA)がHugging Face(USA)との提携を拡大し、AWS上で次世代版の言語モデルを構築するとしています。
LLM周辺技術が急速に進化しており、ビッグテックとしても手掛けないわけにはいかない領域であり、またスタートアップ側も大規模なデータ学習に資金や計算リソースも必要であることがこれらの提携の背景にあるようです。
そして、このLLMに接続してChatGPTなどのテキスト生成AIサービスが作られています。
他に、ChatGPTなどの比較的汎用性が高いテキスト生成AIサービスのAPIにつなげることで、テキスト生成AIを組み込んだ別のサービスも開発されているようです。
ユーザが利用するのは、これらのサービス部分です。ユーザが利用するにあたって、そのまま利用できる場合やサービスもあれば、データ読み込みや小規模な開発によって自社に最適化したうえで使う場合やサービスもあるようです。
デスクワーク全般に向けたサービスや、特定用途に最適化可能なサービスが登場
デスクワーク全般の生産性向上を目的としたテキスト生成AIサービスは、ビックテック各社がサービス提供を開始、もしくは開始しようとしています。また有料無料問わず、様々なサービスが登場し始めており、今後も拡大していくでしょう。
(改めて)2022年11月にOpenAIがChatGPTを基本無料のサービスとして公開しました。2023年2月にはMicrosoftがGPT-4を同社の検索エンジンである「Bing」に利用、また同社のブラウザである「Edge」への融合したデモを行い、既に一部の希望したユーザには提供を始めました。
またMicrosoftもGoogleも、自社のオフィスソフトなどへの導入を進めると発表しています。
ほかにも、GitHubが前述の「GitHub Copilot」、Notion(USA)が文書生成や校正、議事録作成などをアシストする「Notion AI」、Zoom(USA)はOpenAIと提携しミーティング内容の要約などを行う「Zoom IQ」をリリースしています。
また特定用途向けでは、自社のデータで最適化するサービスが増えています。Salesforce(USA)の「Einstein GPT」は顧客データをリアルタイムで学習し、パーソナライズされたメール案文や質問応答を生成できます。
Writer(USA)は、自社のデータを利用してテキスト生成AIをトレーニングし、自社ブランドに合わせたメール、SNS、ブログの文体を作成できます。
無料・有料問わず、自社の情報をサービス提供元で利用するため、情報セキュリティの観点は必要となるでしょう。
特にサービスを無料で利用する場合には、利用自体がさらなる学習のデータとして使われることが利用規約として含まれることや、その情報の第三者への機密情報流出のリスクもあります。生産性改善と情報セキュリティニーズの両面を考慮しながら、有料サービスを含めた検討が必要でしょう。
では、最後に、ChatGPTで株価算定について聞いた結果を一部あげておきます。


東大の入試解いてくれたけどパスできたかわからないし、株価算定はまだできなさそうですね。では。