生成AIを使うときに知っておきたいキーワード(初心者向け)ハルシネーション、アーティファクト、理想的なプロンプト実例

生成AIを使うときに知っておきたいキーワード(初心者向け)

キーワード 説明
プロンプト AIに指示を出すための文章や質問。プロンプトの書き方次第で出力の質が大きく変わる。
アーティファクト AIが生成した成果物(コード、画像、文書など)のこと。会話の中で参照・更新できる。
トークン AIが処理する言語の最小単位。日本語では1文字が複数トークンになることも。文章の長さはトークン数で計測される。
ハルシネーション AIが事実と異なる情報を自信を持って生成してしまう現象。特に詳細な事実や数値データで発生しやすい。
ファインチューニング 特定の目的やスタイルに合わせてAIモデルを追加訓練すること。企業独自のモデル開発に使われる。
コンテキストウィンドウ AIが一度に処理できる文脈の長さ。長い会話や文書を扱う際の制限となる。
RAG (検索拡張生成) AIが外部データベースを検索して回答の質を高める手法。最新情報や専門知識の提供に有効。
マークダウン AIとのやり取りで使われる軽量マークアップ言語。見出しやリスト、コードブロックなどを簡単に表現できる。
テンペレチャー 出力の多様性を調整するパラメータ。低いと一貫性のある回答に、高いと創造的だがバラつきのある回答になる。
チェーンオブソート AIに「考えるステップ」を踏ませる手法。複雑な問題解決や推論の質を高められる。
マルチモーダル テキスト以外に画像や音声なども処理できるAIの能力。画像を見て説明したり、画像生成などができる。
エンベディング 単語や文章を数値ベクトルに変換する技術。類似性の計算や検索に使われる。

 

なぜハルシネーションがおこるのでしょうか

ハルシネーション(幻覚)が生成AIで発生する理由はいくつか考えられます:

  1. 統計的予測の限界: 生成AIは基本的に「次に来る可能性が高い文章はどれか」を統計的に予測しています。これは必ずしも「事実に基づいた」予測ではありません。つまり、もっともらしく聞こえる文章を生成することと、事実に基づいた文章を生成することは別問題なのです。
  2. 学習データの限界: AIは学習したデータの範囲内でしか「知識」を持ちません。そのデータに含まれていない情報については、既存パターンから推測するしかなく、それが不正確な情報生成につながります。
  3. 自己強化のループ: AIが一度不正確な情報を生成すると、その後の文脈でその情報を「事実」として扱い、さらに不正確な情報を積み重ねていくことがあります。
  4. パターン補完の過剰適用: AIは文脈から「穴埋め」をすることが得意ですが、情報が不足している場合でも無理に穴埋めをしようとして、誤った情報を生成することがあります。
  5. 複雑な質問への過剰な自信: 特に複雑な問いかけに対して、AIは「わからない」と答える代わりに、部分的な知識から全体像を組み立てようとし、結果として不正確な情報を提供することがあります。

このようなハルシネーションへの対策としては、AIの回答を鵜呑みにせず、特に重要な事実や数値データについては別の情報源で確認することが重要です。また、AIに対して「確信がない場合はそう伝えてほしい」と指示することも有効な場合があります。

AIの回答がひとつのアーティファクトに収まらないときどうしたらいい?

AIの回答が1つのアーティファクトに収まらない場合、以下の方法で対処できます:

  1. 複数アーティファクトの作成をリクエストする: 「この内容を複数のアーティファクトに分けて提供してください」と明示的に依頼します。例えば、「コードと解説を別々のアーティファクトに分けてください」など。
  2. 内容を優先順位づけする: 「最も重要な部分だけをアーティファクトに含め、残りは会話の中で説明してください」と伝えます。
  3. 段階的に情報を要求する: 「まずは概要のアーティファクトを作成し、その後で詳細を別のアーティファクトとして提供してください」というように、順を追って情報を得る方法もあります。
  4. 目的を明確にする: 「特にXについての情報が必要です」と具体的に伝えることで、AIが最も関連性の高い情報をアーティファクトに含められます。
  5. フォーマットの変更を提案する: 「より簡潔な表形式でまとめてください」など、情報の密度を高める方法を提案するのも効果的です。

アーティファクトはコード、文書、図表などの整理された情報を扱うのに適していますが、すべての情報をアーティファクトに詰め込む必要はありません。会話形式での説明と組み合わせることで、より理解しやすい形で情報を受け取ることができます。

理想的なプロンプトはどういうものでしょうか

理想的なプロンプトには以下のような特徴があります:

  1. 明確な目的と指示
    • 何を求めているのかを具体的に伝える
    • 曖昧さを排除し、期待する出力形式を明示する
  2. 適切な文脈提供
    • 背景情報や前提条件を含める
    • ターゲットオーディエンスや使用目的を説明する
  3. 構造化された情報
    • 箇条書きや番号付きリストで要点を整理する
    • 複数の指示がある場合は優先順位を示す
  4. 具体例の提示
    • 望ましい回答の例を示す(「以下のような形式で回答してほしい:…」)
    • 避けたい回答の例も示すとさらに効果的
  5. 必要なパラメータの指定
    • 回答の詳細度(簡潔か詳細か)
    • 専門性のレベル(初心者向けか専門家向けか)
    • 文体やトーン(フォーマル、カジュアル、教育的など)
  6. 適切な長さ
    • 必要な情報を過不足なく含める
    • 冗長すぎず、短すぎない

例えば、「AIについて教えて」よりも「初心者向けにAIの基本原理を500字程度でわかりやすく説明し、実生活での3つの応用例を含めてください」の方が理想的なプロンプトに近いです。

最終的に、良いプロンプトとは「AIと人間の間の明確なコミュニケーション」を可能にするものだと言えるでしょう。

 

具体例を示してください

理想的なプロンプトの具体例

1. 情報収集のプロンプト

悪い例:

再生可能エネルギーについて教えて

良い例:

再生可能エネルギーの主要な種類(太陽光、風力、水力、地熱、バイオマス)について、以下の観点から比較してください:
1. 発電効率と設置コスト
2. 環境への影響
3. 日本での普及状況と将来性
4. 技術的な課題

回答は一般の大学生が理解できるレベルで、表形式にまとめ、1000字程度でお願いします。特に、各エネルギー源の長所と短所を明確にしてください。

2. コード作成のプロンプト

悪い例:

Pythonでデータ分析するコードを書いて

良い例:

以下の条件を満たすPythonコードを書いてください:

目的: Excelファイル(sales_data.xlsx)から売上データを読み込み、月別・商品カテゴリ別の売上推移をグラフ化する

要件:
- pandas, matplotlib, seabornを使用すること
- Excelファイルの構造: 日付(date)、商品ID(product_id)、カテゴリ(category)、売上金額(amount)の列がある
- 複数の商品カテゴリ(家電、衣類、食品など)が存在する
- 月別の売上合計と前年同月比を計算する関数を含めること
- 見やすいグラフにするため、適切な色分けとラベルを設定すること

コードは実行可能な完全なスクリプトとして提供し、各部分に簡潔なコメントを付けてください。初心者にもわかりやすい説明を加えてください。

3. 文章作成のプロンプト

悪い例:

プレゼン資料を作って

良い例:

新しいオンライン学習プラットフォーム「LearnConnect」のプレゼン資料の原稿を作成してください。

対象読者: 教育機関の管理者と教師(IT技術に詳しくない人も含む)
目的: プラットフォームの導入を検討してもらうこと

含めるべき内容:
1. 導入部(現代の教育課題と解決の必要性)
2. プラットフォームの特徴(使いやすさ、多様な学習形式、進捗管理機能)
3. 導入事例と成功例(2-3例)
4. 導入コストと期待できるROI
5. 導入までのステップとサポート体制

トーン: プロフェッショナルながら親しみやすく、専門用語は最小限に
長さ: 5分程度で話せる分量(約800-1000字)
形式: 箇条書きではなく、自然な話し言葉で作成

特に「教師の負担軽減」と「学習効果の向上」を強調してください。

4. 創作・物語作成のプロンプト

悪い例:

面白い短編小説を書いて

良い例:

以下の設定に基づいた短編SF小説を書いてください:

設定:
- 舞台: 2150年の東京、AIが社会の大部分を支えている
- 主人公: 37歳の女性考古学者、真田美咲。AIの誤作動で失われた古代データの復元に取り組んでいる
- 問題: 彼女が発見した古代アルゴリズムが、現代のAIシステムに予期せぬ影響を与え始める
- ひねり: 主人公が復元したデータは実は未来からのメッセージだった

スタイル:
- 一人称視点で語る
- 情景描写を豊かに
- ダイアログと内省のバランスを取る
- 伏線を効果的に張り、最後に回収する

長さ: 約2000字程度
ターゲット読者: SF好きの大人
目的: テクノロジーの進化と人間性の関係性について考えさせる

「人間の直感とAIの論理の融合」をテーマにしてください。

5. 分析・評価のプロンプト

悪い例:

この製品レビューを分析して

良い例:

以下の新型スマートフォン「TechX Pro」のレビューテキストを分析してください:

[レビューテキストをここに挿入]

分析すべき点:
1. 感情分析: 全体的なトーンは肯定的か否定的か(数値スコア1-10でも評価)
2. 主要な言及ポイント: カメラ、バッテリー、使いやすさなど、言及された製品特徴をリストアップ
3. 競合比較: レビュー内で比較されている他の製品と、その優劣関係
4. 推奨パターン: レビュアーが製品をおすすめしている対象ユーザー層
5. 改善点: 指摘されている問題点や改善すべき点

出力形式:
- 各分析ポイントの見出しを付けた構造化された形式
- 可能な限りレビューからの直接引用を含める
- 分析の最後に、製品開発チームへの3つの具体的な提案を含める

この分析は製品マーケティングチームと開発チームで共有されます。