生成AI基礎用語集
🎯 中心的な主張
生成AIの急速な進化により新しい概念やワードが次々と登場する中、基本的な50用語を体系的に理解することで、AI時代における一般教養としての必須知識を身につけ、企業の生成AI導入率約40%という現実に対応した現代人の必須スキルを獲得できる。
📖 詳細な説明
生成AIに関する基本的な用語を50パターン紹介します。これからの時代に必要な一般教養として、AIの基礎知識を身につけましょう。
🧠 基本概念とモデルの種別
生成AI
画像や文章など新しいデータを作り出すAIの総称。ChatGPT、Claude、Midjourney、Geminiなどが該当する。
モデル
学習済みの脳そのもの。アルゴリズムと重みが詰まったファイル。アプリはこれを呼び出して答えを作る。GPT-4、Claude 3 Opusなど。
LLM(大規模言語モデル)
大量の文章を学習し、人の質問に答えたり文章を生み出したりできる巨大な言語AIモデル。
AGI(汎用人工知能)
人間と同等以上の全ての知的作業をこなす仮想ゴール。現状のAIはまだ達していないとされる。
📚 モデルの学習・最適化手法
知識蒸留
大きなモデルの知識を小さいモデルへ移し、軽量高速化する技術。GPT-4 Miniなどが例。
機械学習・ディープラーニング
データからパターンを学ぶAIの作り方。大規模モデルの土台となる技術。
ファインチューニング
既存モデル全体を再学習し、特定分野に特化させる技術。企業独自のチャットボット開発などで重要。
LoRA
軽い追加パーツだけ学習し、低コストで微調整する技術。Stable Diffusionの画像生成などでよく使われる。
RLHF
「人間からの強化学習」。人の評価でご褒美を与え、AIを訓練する方法。
ゼロショット・フューショット
サンプル事例なしでAIとやり取り(ゼロショット)か、サンプル事例を見せてから行う(フューショット)か。
💬 プロンプト設計と制御技術
プロンプト
AIとの対話や操作のために、ユーザーが入力する指示や質問のこと。
システムプロンプト
AIに絶対守らせる最優先の指示書。敬語で答える、個人情報禁止などの指示。システムインストラクションとも呼ばれる。
プロンプトエンジニアリング
望む振る舞いを引き出す入力設計技法。ロール設定や制約などを組み合わせ、最適な応答を得る方法。
テンプレートプロンプティング
固定ひな形に変数だけ入れて呼び出し、一貫した出力を得る運用方法。
プロンプトインジェクション
悪意ある質問でAIに秘密漏洩などをさせる攻撃手法。入力の検査が必須。
🤔 思考フローと対話管理
トークン
単語、句読点、部分単語などモデルが1単位として扱う文字列。AIの処理単位。
コンテキストウィンドウ
AIが1度の会話で覚えていられるトークン数の上限。長すぎると古い部分が切れる。
ハルシネーション
AIが事実確認をせず嘘の答えを自信満々で出す現象。根拠付きや人のチェックで軽減可能。
チェインオブソート(CoT)
AIに考えの途中経過を喋らせて正解率を上げる方法。GPT-3.5などの思考モデルに採用。
エージェント
LLMを目的達成の主体として扱う設計概念。目標を渡すと計画、ツール実行、振り返りを自動で回し結果を届ける。
MCP(モデルコンテキストプロトコル)
ルール、タスク、メモを区分けしてAIに渡す共通フォーマット。「USBCポート」とも表現される。
バイブコーディング
会話で要望しAIが生成、すぐ実行して出力を確認する高速PDCA型の開発スタイル。「雰囲気でコーディング」の意。
🔍 検索・知識拡張・データ手法
ナレッジ
AIが持つ一般知識プラス会社のマニュアルなど外部データをまとめた知識ベース。
ナレッジカットオフ
AIが最後に学習した日付。それ以後の出来事は知らない。
ベクトル埋め込み
言葉や画像を多次元の数字の点に変え、意味が近いほど近くに並べる表現手法。似たデータを高速に探せる。
ベクトルデータベース
画像や文章をベクトルに変えて保存し、似たデータをすぐ見つけられるデータの倉庫。
RAG(検索拡張生成)
ベクトル検索で取得した文章をプロンプトに連結し、根拠付き解答を生成する技術。ハルシネーション抑制に有効。
AI検索
AIがユーザーの意図や文脈を理解し、最適な検索結果を提供するシステム。自然な会話で直接的な回答が得られる。
ディープリサーチ
生成AIがWebや論文を自立的に集めて分析し、引用付きレポートを作るAI調査アシスタント機能。
LLMO
生成AIに自分のサイトを正しく理解・引用してもらうためのコンテンツ最適化手法。SEOの次世代版。
🎨 マルチモーダルとメディア生成
ビジョンランゲージモデル
画像を見て文章を出すなど、視覚と言葉を合体させたモデル。
T2I(テキストtoイメージ)
テキストを入力すると、その内容に合致する画像を生成するモデル。
I2I(イメージtoイメージ)
既存画像を入力し、別の見え方へ変換・編集する仕組み。GPTのジブリ風変換などが例。
T2V(テキストtoビデオ)
テキストプロンプトだけで、秒単位の動画クリップを生成するモデル。
TTS(テキストtoスピーチ)
文字を読み上げにしてAIが声に変えて読み上げる仕組み。ElevenLabsなどが有名。
音声認識(STT)
マイクで拾った声をAIがリアルタイムで文字に変える技術。字幕表示や音声操作に活用。
マルチモーダル
文字、画像、音声など複数の情報をまとめて理解して生成できるAI。現在のAIの主流。
⚙️ 運用・オペレーション
インテグレーション
複数の異なる要素を組み合わせて統合・連携させるプロセス。アプリ接続機能など。
LLMOps
大規模言語モデルを社内サービスとして安定・安全に運用するためのノウハウとツール群。
AIワークフロー
AI技術を業務プロセスに組み込み、タスクの自動化や意思決定を支援する仕組み。
API
異なるアプリケーションやソフトウェア同士をつなぎ、データや機能を共有するための仕組み。
JSON
データを名前と値で表現する軽量ファイル形式。人が読めてコンピュータもすぐ理解できる。
YAML
インデントとコロンだけで階層を表す、メモ書き風の設定ファイル。リスト形式のデータ表現に便利。
💻 ハードウェアとプラットフォーム
NVIDIA
GPUを主力とする米国企業。AI計算が得意な最新GPUを開発し、世界中のAIスーパーコンピューターを支える。
NPU
脳の仕組みを真似た回路で、1秒に何兆回も演算しAIの重たい計算を低電力でこなす専用チップ。
AI PC
NPUなどAI専用チップを搭載し、ネットに頼らず画像生成や翻訳を即実行できる新世代PC。コパイロットPCとも。
コパイロット
Microsoftが提供するAIアシスタントサービス。Wordなどで下書きを作ったり、PCを音声操作したりできる。
チャットボット
AIと会話するようにテキストや音声で応答するプログラム。ChatGPT、Claude、Geminiなど。
📊 実例・証拠
📈 社会実装の現状
- 企業導入率: 生成AI導入率は約40%と高まっている
- 教育分野: 東京都の学校でもAI学習が開始
- 世代格差: 若い世代のAIリテラシー向上に対応した大人の学習必要性
🎯 技術発展の方向性
- マルチモーダル化: 文字・画像・音声の統合処理が主流
- 専用ハードウェア: NPU搭載AI PCの普及
- 業務統合: AIワークフローによる業務プロセス最適化
🔧 実用化領域の拡大
- 検索技術: 従来SEOからLLMOへの進化
- コンテンツ生成: T2I、T2V、TTSによる多様なメディア生成
- 企業運用: LLMOpsによる安定的なAIサービス運営
❓ 派生する問い
- AI技術の急速な進化に対応した継続的学習戦略は?
- 企業でのAI導入における技術選択とROI評価の基準は?
- マルチモーダルAIの普及による既存職種への影響と適応方法は?
🏷️ タグ
- note
- 生成AI
- 用語集
- LLM
- マルチモーダル
- プロンプトエンジニアリング
- RAG
- AI PC
- 基礎知識
- AI教育