ワークフロー自動化・生成AI・SaaS|AIエージェントが繋いだ3つの世界

AIエージェントの世界に足を踏み入れて数か月、AIエージェント・業務自動化に関連するツールや技術に一通り触れてきました。

その中で見えてきたのは「AIエージェント」というのは、10年以上前から存在する3つの異なる世界が相互に影響を与えながらここ数年で形作られてきた新しい領域だという事です。

これは関連する技術のコンセプトや立ち位置を理解する上で、重要な前提知識だと思うのでみなさんと共有したいと思います。

この記事は、僕のようにWebアプリケーション開発からキャリアを始めて、ChatGPT以降にAI実装の現場に足を踏み込んだ開発者に向けて書いています。AIエージェントの周辺で起きている現象を理解するには、技術スタックの解説よりも先に、この異なる3つの世界の成り立ちと、その世界がどのように相互に影響を与えてきたかを理解するのがいいと思います。

目次

独立していた3つの世界

それぞれの世界には異なる住人が異なるツールを使って異なる価値観がありました。

第1の世界|ワークフロー自動化 / iPaaS

この世界の住人は、業務オペレーター、マーケター、情報システム担当者、中小企業の経営者、バックオフィスの担当者です。

この世界のコンセプトは、「人が繰り返しおこなう作業を機械に置き換える」というシンプルなものです。トリガー、条件分岐、アクションなど、聞き慣れたif-then-elseの発想です。元々はAIの関与しない世界でした。

この世界は規模は決して小さくなくZapierだけで月間アクティブユーザーが1,000万人超です。しかも Zapier のiPaaS市場シェアはわずか7%程度ですから、Make、Power Automateなどを含めれば、世界全体では数千万人から1億人規模のエンドユーザーが存在することになります

この世界の特徴は住人の大半が「開発者ではない」という点です。コードを書かない人たちが、ノーコードのGUIを通して、業務フローを組み立てています。この世界の住人は、Stack OverflowにもQiitaにもほとんど現れません。

代表的なツールは、IFTTT(2010年)、Zapier(2011年)、Microsoft Flow / Power Automate(2016年)、Integromat / Make(2016年)、n8n(2019年)です。

ワークフロー自動化のパイオニアとしてIFTTT(2010年)があります。IFTTTはコンシューマー向けで、ビジネス向けiPaaSとは系譜が異なりますが、ワークフロー自動化の歴史を語る上で、外せない存在です。

ワークフロー自動化ツールには、UiPath、WinActor、BizRobo!などのRPA(Robotic Process Automation)型も存在します。これらはAPI通信を行わず、ボタンのクリック動作をそのまま自動化するといったSeleniumの流れを汲むソフトウェアです。

第2の世界|LLM研究 / 自然言語処理

この世界の住人は、AI研究者、機械学習エンジニア、データサイエンティストなどです。

歴史的には、Word2Vec(2013年)、Transformer論文「Attention Is All You Need」(2017年)、BERT(2018年)、GPT-2(2019年)、GPT-3(2020年)といったマイルストーンの上に成り立っています。

価値観は「自然言語をどう理解させ、生成させるか」「モデルをどうスケールさせるか」。技術論文、ベンチマーク、新しいアーキテクチャ、計算資源のスケーリングが思考の中心でした。

この世界は、3つの中で最も人口が少ない世界です。世界のAI関連エンジニアは1,170万人規模と推計されますが、この数字にはいくつかの異なる層が混在しています。LLMや基盤モデルそのものを研究するリサーチサイエンティスト、社内データで独自モデルを学習する機械学習エンジニア、モデルのデプロイや運用を担うMLOpsエンジニア、そして既存LLMをAPIで呼び出して自社プロダクトに組み込むAIエンジニアです。

このうち、本物のLLM研究を推進している中核研究者は世界にたったの1万人前後と推測されます。つまり、AIエンジニアはある程度の数が存在しますが、生成AIの開発に携わっているのはごくわずかということです。

第3の世界|Webアプリケーション / SaaS

Webアプリケーションの世界は、僕が長年、生きてきた世界です。読者の多くもおそらくここに属しているはずです。

住人は、フロントエンド・バックエンドエンジニアやプロジェクト関係者です。代表的なツールスタックは、React、TypeScript、Spring boot、Figmaなどです。

価値観は「UI/UXの観点を踏まえたUI制作」「スケーラビリティを重視した設計」「クリーンで読みやすいコード」などです。

ウェブアプリケーションは、以前まで主役だったインストール型のデスクトップソフトを代替する形で普及しました。今ではエンジニアと言えばWeb系エンジニアを指す、といっても過言ではないほどにメインストリームになりました。

規模は3つの中で圧倒的に大きく、世界のソフトウェア開発者は約4,720万人(2025年初頭時点)。SaaS企業は世界に3万社強、SaaSの市場規模は約3,170〜3,900億ドルです

この世界の住人にとって、SaaSは「独立したUIを持つ完結したプロダクト」でした。自社プロダクトを作り、ユーザーに使ってもらい、サブスクリプションで対価を得る。これが基本の構造です。


2022年11月、ChatGPTという衝撃

3つの世界が独立して存在していた状態に、決定的な変化が起きたのは2022年11月のChatGPT公開でした。

技術的に見れば、ChatGPTはGPT-3.5のチューニング版を会話インターフェイスで包んだだけのプロダクトです。しかしその影響は、3つの世界それぞれに波及しました。

第1の世界(ワークフロー自動化)の反応は、当初は比較的緩やかでした。この世界がAIエージェント機能を取り込むのは少し後で、ZapierがAI機能を統合し始めたのは2023年後半です。

第1の世界(ワークフロー自動化)

この世界の反応は、当初は比較的緩やかでした。この世界がAIエージェント機能を取り込むのは少し後で、ZapierがAI機能を統合し始めたのは2023年後半です。

第2の世界(LLM研究)

この世界の住人にとっては、長年の研究成果が一般大衆に届いた瞬間でした。技術的なブレイクスルー以上の意味を持つ出来事です。

第3の世界(Webアプリ/SaaS)

第3の世界の住人ももちろんChatGPTの存在を知っていたものの、今後、生成AIが自分の人生に大きな影響を与えると考えている人は一部でした。ChatGPTはユーザの質問に答える形でインターネットの情報をかき集めてくるツールという見方も当時は根強かったです。

そして2022年10月、ChatGPT公開の1ヶ月前に、もう一つの重要な出来事が起きていました。LangChainの登場です。これがその後の流れを決定づけることになります。


3つの世界が相互につながり始めた

ChatGPT以降の3年間で起きたことを、最もシンプルに表現すると、3つの世界が相互につながり始めた、ということです。接続は3つの方向で同時に進行しました。

3つの世界の交わり|象徴的な出来事の年表

凡例:🔵 第1の世界(ワークフロー自動化) 🟣 第2の世界(LLM研究) 🟠 第3の世界(Webアプリ/SaaS) 🟡 交差点・接続イベント

2010年代前半|3つの世界が独立に成長

  • 2011年 🔵 Zapier創業、SaaS同士をつなぐ iPaaS という発想が定着し始める
  • 2013年 🟣 Word2Vec発表、自然言語の分散表現が研究界で注目される
  • 2016年 🔵 Microsoft Flow(現Power Automate)と Integromat(現Make)がほぼ同時期にローンチ
  • 2017年 🟣 「Attention Is All You Need」論文、Transformerアーキテクチャの登場
  • 2019年 🔵 n8nがオープンソースの iPaaS としてリリース
  • 2019年 🟣 GPT-2発表、生成系言語モデルの可能性が見え始める

2020〜2022年|LLMが力を蓄え、ワークフロー自動化が定着

  • 2020年 🟣 GPT-3発表、API経由でLLMを使う実験的なプロダクトが少しずつ出始める
  • 2021年 🟠 Vercel・Supabase・Next.jsを中心としたモダンWebスタックが定着する
  • 2022年10月 🟣 LangChain登場、LLM呼び出しを「チェーン」として組み立てる発想が広まる
  • 2022年11月 🟡 ChatGPT公開、3つの世界の住人がほぼ同時に「LLMを業務に使う」というテーマを意識し始める

2023年|接続の始まり

  • 2023年3月 🟣 GPT-4公開、Function Calling 機能の発表
  • 2023年9月 🟣 Microsoft Research が AutoGen を公開、マルチエージェント実装の選択肢が増える
  • 2023年後半 🟡 n8n が LangChain ノードを統合、🔵と🟣の世界が技術レベルで接続し始める
  • 2023年後半 🟠 Vercel AI SDK 公開、WebアプリへのLLM組み込みが定型化する

2024年|接続の加速

  • 2024年1月 🟣 LangChain から LangGraph がスピンオフ、エージェントを状態機械として設計する流れが本格化
  • 2024年初頭 🟣 CrewAI 登場、ロールベースのマルチエージェント設計が流行する
  • 2024年 🟡 Zapier AI Actions、Make AI Agents、Power Automate × Copilot Studio の統合が相次ぐ
  • 2024年11月 🟡 Anthropic が MCP(Model Context Protocol)を公開、SaaS をエージェントから呼び出す標準プロトコルが登場

2025年|MCP を軸とした業界標準化

  • 2025年〜 🟡 GitHub・Slack・Notionなど主要SaaSが公式 MCP サーバーを次々公開
  • 2025年3月 🟡 OpenAI が MCP 対応を表明
  • 2025年4月 🟡 Google DeepMind が MCP 対応を表明
  • 2025年 🔵 n8n が MCP ノードを公式実装、🟣 LangGraph も MCP クライアント機能を備える

「生成AI」と「ワークフロー自動化」がつながった

LLM研究の側からは、AIエージェントを「ワークフロー的な制御構造」で動かそうという動きが活発化しました。LangChain、AutoGen、CrewAI、LangGraphが次々と登場しました。

逆方向では、ワークフロー自動化ツールがAIエージェント機能を取り込み始めました。n8nが2023年後半にLangChainノードを統合、ZapierがAI Actionsをリリース、Power AutomateがCopilot Studioを統合しました。

ここで興味深いのは、両者が同じ問題に別のレイヤーから取り組んでいることです。LangGraphは「LLMのオーケストレーションを担うツール」として低レイヤーから設計されています。一方n8nは「あらゆるSaaS/APIをつなぐ iPaaS」として高レイヤーから設計されています。

「生成AI」と「SaaS」がつながった

Webアプリ/SaaSの世界に、LLMを統合するためのインフラも整いました。Vercel AI SDK、Next.js AI Templates、LangChain.jsによるブラウザ側でのLLM実行サポート。

これにより、Webアプリの中にLLMを組み込むことが特別なことではなくなりました。2026年現在は多くのコーポレートサイトがAIチャットを装備しており、もはやWeb業界においては標準になったと言ってもいいでしょう。

「SaaS」と「ワークフロー自動化」がつながった

「SaaS」と「ワークフロー自動化」の繋がりは、2022年以前からひそかに存在していました。Webアプリ開発者がZapierをって自社プロダクトの連携を作る、SaaSがネイティブにZapier連携を提供する、といった形です。

しかしAIエージェントの登場がこの繋がりを一気に強化しました。Webアプリ開発者がn8nやMakeを業務実装のために使うようになり、SaaSベンダーがワークフロー自動化機能を自社プロダクトに組み込み始めました。


3つの交差点に立ち上がった「AIエージェント」

3つの世界が相互につながった結果、その中心、3つの交差点に新しい概念が立ち上がりました。それがAIエージェントです。

この概念は、3つの世界のどれにも完全には属していません。3つの世界が交差する場所にあります。LLMの能力を中核としつつ、ワークフローの制御構造を持ち、外部システムと接続するためのインターフェイスを備えている、という構造です。

開発者にとってAIエージェントを実装する手段は複数あります。LangGraph、CrewAI、AutoGenのようなLLMフレームワーク(Multi-Agent Framework)。n8n、Make、Zapier、DifyのようなiPaaS/ノーコード系。OpenAI Function CallingやAnthropic Tool Useのようなネイティブツール呼び出し機能。これらはどれも「AIエージェント」という同じ概念を、別の階層から実装しているだけです。


3つの世界の融合を体現するAnthropic

3つの世界の融合を、最も具体的に体現している例として、Anthropic社の4つの主要なプロダクトの立ち位置を確認します。

Claude(claude.ai)

3つの世界の住人全員が、最初にClaudeプロダクトと出会う場所です。

ブラウザを開いてアカウントを作れば、誰でも使えます。研究者にとってはモデル挙動の確認窓口、Webエンジニアにとっては1つのSaaSプロダクト、業務ユーザーにとってはMCPサーバーを接続して使うワークフローの起点。

3つの世界の住人それぞれに、異なる意味を持つプロダクトです。Anthropicプロダクト群の玄関と表現してもいいかもしれません。

Claude API

第2(LLM)の世界が第1(ワークフロー)・第3(SaaS)の世界に向けて提供するパイプのような存在です。

Webアプリに組み込む場合も、n8nのワークフローに組み込む場合も、LangGraphで自律エージェントを作る場合も、必ずどこかでClaude APIを呼ぶことになります。Claude API自体は単体ではどの世界にも完全には属さない、3つの世界をつなぐインフラとして機能しています。

Claude Code

第3(SaaS)の世界向けに2024年から提供されている、ターミナル上で動くAIコーディングエージェントです。

当初はGitHub CopilotやCursorと同じ「AIコーディング支援」カテゴリーとして登場しましたが、現在ではコーディング以外の作業も任せられる汎用エージェントへと拡張されています。MCPサーバー対応、カスタムスキル定義、サブエージェント並列実行などの機能が追加され、第3の世界出身でありながら第1の世界(ワークフロー自動化)の領域に侵食しているプロダクトに位置づけられます。

Claude Cowork

2026年1月にAnthropicが発表した、デスクトップエージェントです。

Claude Desktopアプリ内で動き、ユーザーが指定したローカルフォルダにアクセス権限を付与する形で、ファイル整理、Excel生成、レポート作成、Web情報収集などを自動化します。ターゲット層は開発者ではなく、マーケッター、リサーチャー、事務担当者などの業務ユーザーです。Anthropicが第1の世界(ワークフロー)の市場に直接踏み込んだ最初のプロダクトと位置づけられます。Fortune誌が「数十のスタートアップを脅かす可能性」と評したように、業界はこれを既存ワークフロー自動化市場への侵略として認識しています。

二層構造は業界標準になりつつあります

この「全ユーザー向けハブプロダクト + 世界別の専用プロダクト群」という二層構造は、Anthropic単独の戦略ではありません。OpenAI、Googleもすぐに後を追いました。

提供元ハブプロダクトAPI開発者向け業務ユーザー向け
AnthropicClaudeClaude APIClaude CodeClaude Cowork
OpenAIChatGPTOpenAI APICodexChatGPT Operator
GoogleGeminiGemini APIGemini Code AssistGemini for Workspace

LLM研究機関として始まった企業が、わずか3〜5年で3つの世界すべてにプロダクトを持つプラットフォーマーへと変貌しているわけです。

2022年以前、こうした展開は構造的に困難でした。研究機関は研究機関のまま、開発者向け製品は別会社が、業務ユーザー向け製品はさらに別の会社が作る、という分業が当然視されていたためです。3つの世界の境界が崩れたからこそ、1社が3つの世界全部にプロダクトを持つことが可能になったと言い換えてもいいかもしれません。

あなたがどの世界の住人かによって、入口は変わる

3つの世界が交差している現状を理解したうえで、これから何をすべきかは、あなたがどの世界の住人だったかによって変わります。

第1の世界(ワークフロー)の住人

すでにAIエージェントの本質に最も近い場所にいます。ZapierやPower Automateで業務フローを組んできた経験は、LLM時代でもそのまま活きます。むしろ第2の世界の住人より、AIエージェントの実務応用ではアドバンテージがあるかもしれません。

第2の世界(機械学習)の住人

第1の世界(ワークフロー)と第3の世界(SaaS)の視点を補強する必要があります。LLMの精度を高めることと、それが業務フローに乗ること、ユーザーに価値が届くことは別の問題です。実務応用で最も詰まりやすいのはここです。

第3の世界(SaaS)の住人

第1の世界(ワークフロー)と第2の世界(LLM)の両方に、意識的に踏み込む必要があります。具体的には、n8nのようなiPaaSを実際に触ってみること、LangGraphのような状態機械フレームワークでエージェントを組んでみること、この2つを並行して進めるのがおすすめです。


SaaSがワークフローに取り込まれる流れは止まらない

3つの世界の収束は、今後さらに進むでしょう。

その最も有力な仕組みとして、現時点でMCP(Model Context Protocol)が業界標準の位置を取りつつあります。GitHub、Slack、Notionをはじめとする主要SaaSが公式MCPサーバーを公開し、OpenAIとGoogleも対応を表明しました。

この流れは海外SaaSに限った話ではありません。freee、マネーフォワード、kintoneといった日本の主要SaaSも、APIの公開と外部連携機能の拡充を進めており、MCP対応や類似のエージェント連携機能を備える方向に向かうのは確実だと考えています。

ただし、MCPが業界標準として完全に固まるかは、いくつかの未解決問題に依存します。認証・認可の標準化、プロンプトインジェクションを含むセキュリティモデル、Google A2AやIBM ACPなど競合プロトコルとの関係、SaaSベンダー側の課金モデル変化への対応など、まだ流動的な要素は残っています。

それでも、SaaSがワークフローに取り込まれる方向性そのものは、もう巻き戻らないと考えています。SaaSが「独立したUIを持つ完結したプロダクト」から「ワークフローの中の部品」に位置づけを変えていく流れはすでに進行しています。この流れはWebアプリ開発者にとって、過去20年で最大級のパラダイムシフトです

第1の世界の住人にとって、この方向性は「すでにZapierで毎日やっていることの延長」として自然に受け取れるものですが、第3の世界の住人にとっては、自分たちが作ってきたSaaSの存在意義を問い直す必要があります。


おわりに

この記事で書いた「3つの世界モデル」は、僕がAIエージェントの世界に踏み込んでいく中で、後から整理した地図です。自分が学習している最中は、こういった整然とした地図は見えていませんでした。

もしこの記事を読んでいるあなたが、当社と同じくWebフロントエンド出身でAI実装の現場に立っているなら、おそらく今、似たような混乱と発見の中にいるはずです。3つの世界が交差した結果、ひとつの分野だけを知っていれば仕事になる時代は、もう終わりつつあります。

よかったらシェアしてね!
  • URLをコピーしました!
  • URLをコピーしました!

この記事を書いた人

1981年生まれ、名古屋出身。

2008年よりドイツ・ベルリンに在住。
ドイツの国家資格である職業訓練プログラム「アプリケーション開発専門IT技術者」を修了後、医療系自社開発企業にてデスクトップ・Webアプリケーションの開発に4年間従事。
2022年よりドイツの大手SIer「Adesso SE」にて、フルスタックエンジニアとしてリードポジションを務める。

2026年6月、AIエージェントと業務アプリ開発を軸とする株式会社ニューロシンクを設立。2027年に日本へ帰国し、日本の中小企業へのAI導入支援を本格的に開始予定。

著書「AI時代の海外移住戦略

コメント

コメントする

目次