DEVELOPER’s BLOG

技術ブログ

PoCでは動いた生成AIが本番直前で崩れる理由 ― few-shotの限界 ―

2026.03.16 髙橋 由子
コラム 生成AI
PoCでは動いた生成AIが本番直前で崩れる理由 ― few-shotの限界 ―


  1. はじめに
  2. 生成AIプロジェクトで起きがちなこと
  3. リリース前に起きる問題とよくある対応
  4. 本質的に必要なアプローチ
  5. おわりに


1.はじめに

「PoCではうまくいっていたのに、本番が近づくと急に問題が噴出する」

いくつかの生成AI案件を進める中で、この現象には共通する構造があることに気づきました。PoCでは「使えそう」だったものが、本番直前で「このままでは出せない」と判断されるのです。

原因はモデルの性能不足だけではありません。

多くの場合、課題は進め方にあります。生成AIは、曖昧な要件でもそれらしく動いてしまう一方で、評価基準が定まらないまま進めると、後工程で揺らぎが顕在化します。

本記事では、生成AI活用でよくある失敗パターンと、 安定した成果を出すために必要な考え方について整理してみます。


2.生成AIプロジェクトで起きがちなこと

生成AIを使ったプロジェクトの初期段階では、次のような状況がよく見られます。

  • 生成AIの活用範囲を模索する段階で、要求がまだ抽象的な状態にある
  • 具体的な評価基準が定まらないままPoCが進む
  • 「なんとなく良い」という評価で次のフェーズに進む


この段階では、大きな問題は表面化しません。むしろ「思ったよりできる」という印象を持つことも多いでしょう。
なぜこのようなことが起きるのでしょうか。

生成AIは、要件が曖昧な状態でも一定水準の回答を返せるという特性を持っているからです。

たとえば「わかりやすく説明して」という指示に対して、明確な基準がなくても、それらしい文章を出力します。これは生成AIの強みでもあります。 評価基準がまだ固まっていない段階でも一定品質の出力が得られるため、想定以上に「使えそうだ」という感触のPoCが出来上がることがあります。

その結果、「十分に良いのではないか」という評価のもと、仕様や判断基準が明確に整理されないまま、プロジェクトが次のフェーズへ進んでいくケースも見られます。


3.リリース前に起きる問題とよくある対応

しかし、リリースや本格運用が近づくにつれて状況は変わります。

  • 「ここはこうしてほしい」という具体的な要望が出てくる
  • これまで許容されていた回答の揺れが問題視される
  • リリースを目前にして、初めて「こんなのでは困る」という具体的な目標がわかってくる


つまり、ここで初めて評価基準が具体化するのです。PoC段階では曖昧だった「正解」が、急に具体的な形を持ち始めます。
その結果、これまで見えていなかったズレが一気に顕在化します。

◆よくある対応の落とし穴

多くのプロジェクトで見られるのが、指摘されたケースを例示として追加し、few-shotで挙動を矯正する対応です。

特にリリース直前では、急いで修正する必要があり、影響範囲を限定しながら確実に直したいという判断から、このような対応方法が選ばれやすくなります。

一見、直ったように見えます。 しかし、修正を重ねるほど次のような問題が起きやすくなります。

  • 特定のケースに合わせた指示になるため、そのケースではうまく動くが、少し条件が変わると対応できなくなる
  • 新しい入力パターンでは通用しない
  • few-shotによる例示がどんどん増えていき、全体の一貫性が失われる(あらゆる箇所に「最重要」などの強い指示が増えていく)


結果として、安定して使える状態になりにくくなります。


4.本質的に必要なアプローチ

安定した成果を出す為には、指摘を足していくだけではいずれ限界が来ます。 重要なのは、次のようなプロセスです。

  • お客様からもらった指示をそのままプロンプトに落とし込むのではなく、背景や意図を考える
  • その指示が必要な理由を掘り下げる
  • 期待される結果や出力の形を整理する
  • 複数の要望を共通の判断基準にまとめる
  • その判断基準に沿ってプロンプトを組み立てる


この整理を挟むかどうかで、プロジェクトの安定性は大きく変わります。 判断基準が曖昧なまま具体例だけを増やしても、安定した成果にはつながりません。
「やっとわかってきた具体的要求を噛み砕いて、生成AIにプロンプトという形で指示を与える。」 それは、従来の開発における上流工程で実施していた要求分析から設計、実装に落とすフェーズや、PMがメンバーに業務を指示してきたことに近いのです。


5.おわりに

生成AI案件では、目標が曖昧で、正解が一意でなく、評価基準も途中で変わることが少なくありません。だからこそ、修正のたびに要望をそのまま追加していくのではなく、一度立ち止まることが重要になります。お客様の要望をそのままプロンプトに足し続けると、全体の構造が崩れ、プロンプトが複雑化していきます。
その前に、「本当に必要なことは何か」「本当にモデルに指示するべき内容は何か」を整理することが、安定した設計につながります。


求められるのは、曖昧な要求を整理し、背景意図を読み取り、具体的な期待値を噛み砕いてプロンプトに落とす力です。


生成AIや機械学習の知識だけではなく、「要求をどう整理し、どう指示するか」が成功の鍵となります。 そのため、生成AI活用を成功させるには、単に技術に強いだけでなく、要求分析や要件定義を丁寧に行えるパートナーかどうかという視点も重要になります。


アクセルユニバースでは、こうした要求整理のプロセスを重視し、曖昧なアイデアや構想の段階から整理しながら、生成AIを組み込んだシステムをオーダーメイドで開発しています。生成AIの特性を踏まえた設計を行うことで、PoCにとどまらない実運用につながる形での活用を支援しています。


それが、生成AI活用プロジェクトの難しさであり、面白さであるのかもしれません。

AUCへのお問い合わせ 



X(旧Twitter)・Facebookで定期的に情報発信しています!

関連記事

85% が「自社でも実現できる」と回答。AI エージェントがデータを見て動く時代の業務変革

アマゾンジャパン品川オフィス はじめに AI BPRとは ワークショップの内容 参加者の声 組織への展開と本格導入 1.はじめに 売上や現場の数字を見ながら、次々と判断を下す毎日。「これAIでやってくれないかなぁ」と感じたことはありませんか。 生成 AI のニュースは毎日のように流れてきますが、自社の業務で「使える」という実感を持てている方は、まだ少ないのではないでしょうか。業務の中で日々判断を重ねている方ほど、目の前の業務を AI が

記事詳細
85% が「自社でも実現できる」と回答。AI エージェントがデータを見て動く時代の業務変革
AWS データ分析 生成AI
データと現場の声をAIエージェントが分析!「SMART」で作る新しい店舗運営のカタチ

はじめに 環境構築手順 Store Manager Agentで実現できること まとめ 1.はじめに 店舗運営において、こんなお悩みはありませんか。 売上データは見ているが、次に何をすべきか判断に迷う 売場づくりや品揃えが、どうしてもベテラン頼みになってしまう 在庫・売上・時間帯など、考えるべき要素が多すぎる 数字の振り返りはしているものの、改善アクションに落とし込めない こうした課題は、特定の業種だけのものではありません。 例えば、 ス

記事詳細
データと現場の声をAIエージェントが分析!「SMART」で作る新しい店舗運営のカタチ
AWS データ分析 生成AI
システムリプレイスの進め方ーAI駆動開発で

はじめに 開発フローと注意点 まとめ 1.はじめに 現在、多くの企業で「今動いているシステムをどうするか」という課題に直面しています。長年使い続けてきたシステムは、業務に深く根付いている一方で、技術的な老朽化やブラックボックス化が進み、手を入れること自体が難しくなっているケースも少なくありません。既存システムの設計書や仕様書が存在しない、"触れないシステム"が現場に残り続けているのが実情です。 しかし一方で、こうしたシステムは企業にとって重要

記事詳細
システムリプレイスの進め方ーAI駆動開発で"触れないシステム"を再構築する方法
生成AI
AWS Japan様と共催ワークショップ AIエージェントText2SQLでデータ分析

アマゾンジャパン品川オフィス3階 森のようなアトリウム はじめに Text2SQLとは ワークショップの内容 参加者の声 PoCから本格導入まで 1.はじめに 営業担当から突然、「この商品の半年分の売上推移のデータください」と言われ、思いがけないタイミングでデータ集計に時間を取られてしまう--。そんな依頼を様々な部署から受け、毎日追われている、というご経験がある方もいらっしゃるのではないでしょうか? こうした課題を解決する手段として注目

記事詳細
AWS Japan様と共催ワークショップ AIエージェントText2SQLでデータ分析
AWS 生成AI

お問い合わせはこちらから