【Cody】AI駆動開発でChrome拡張機能をつくった話
🎯 中心的な主張
AI駆動開発ツールCodyを使用したChrome拡張機能YoutubeTranscriptCopier開発実体験として、YouTube動画文字起こしコピー手順簡素化(従来6段階手順→拡張機能1クリック化)とプロンプト付きコピー機能により既存類似拡張機能のアップデート問題・課金制移行問題を自己開発で解決、Cody評価(利点:月額9ドル使い放題・Claude 3.5 Sonnet使用可能・コードベース理解、問題点:apply機能不安定・変更箇所明示不足・コード省略傾向)を通じて、次点Gemini 2.0 flash experimental高速高精度の可能性を検証し、AI駆動開発による個人開発者増加が世界変革をもたらす信念のもと、実用的Chrome拡張機能の自作による保守性確保と開発効率化を実現した包括的開発経験レポート。
📖 詳細な説明
🎬 YoutubeTranscriptCopier開発成果
機能概要と実用性
YouTube動画の文字起こしを簡単にコピーできるツールとして開発されたChrome拡張機能です。単純な文字起こしコピーに加え、プロンプト付きコピー機能を実装しています。
主要機能:
- 単純コピー: 文字起こしのみのコピー
- プロンプト付きコピー: 「プロンプト+文字起こし」の統合コピー
- 自動保存: 入力欄に入れたプロンプトの自動保存
- テンプレート: 要約用プロンプトの3種類×3言語(英語・日本語・中国語)提供
💡 開発動機:手作業効率化の必要性
従来手順の煩わしさ分析
YouTube動画からLLMへの文字起こし活用において、6段階の面倒な手順が存在していました:
- ステップ0: Youtubeの動画を開く
- ステップ1: 「もっと見る」となっている概要欄を開く
- ステップ2: 「文字起こしを表示」をクリック
- ステップ3: 右側の文字起こしを全選択してコピー
- ステップ4: 好きなLLMに貼り付ける
- ステップ5: 「要約して」とプロンプトを加える
既存の問題点
意外と手順が多く、特に文字起こしの一括コピーができないため、動画が長くなるほど選択に時間がかかるという効率性の問題がありました。
🛠️ 自作開発の戦略的理由
既存拡張機能の課題
似たような拡張機能は多数存在し実際に使用していましたが、以下の問題が頻発していました:
技術的問題:
- YouTubeのアップデートによる動作停止
- LLM側のアップデートによる互換性問題
- 頻繁な機能停止
商業的問題:
- 最初は無料、後に課金制への移行
- 課金移行のペースが早い傾向
- サービス継続性への不安
自作による解決策
手元で作れば動かなくなった時に自分で修正できるという保守性の観点から、実際に役に立つものを自作することを決断しました。
🤖 Cody:AI駆動開発ツールの詳細評価
Codyの基本情報
SourcegraphのCodyは、CursorとVSCodeの両方で使用可能なAI駆動開発拡張機能です。CursorのAI開発機能との混同に注意が必要です。
公式URL: https://sourcegraph.com/cody
包括的利点分析
✅ Codyの強力なアドバンテージ:
- コスパ最強: 月額9ドルで使い放題
- 高性能AI: Claude 3.5 Sonnet使い放題
- コードベース理解: プロジェクト全体の文脈を把握
- 競争優位性: 他のAI駆動開発ツールより圧倒的に安価
実際の問題点と制約
⚠️ Codyの課題と改善点:
- apply機能の不安定性: 結構癖があり、適用が下手
- 変更箇所の不明確性: 変更箇所を明示しない傾向
- コード省略: 省略してコードを提示することがある
🔬 AI モデル比較と将来展望
Claude 3.5 Sonnet の現状評価
2025年1月9日現在、Claude 3.5 Sonnetはプログラミング分野で最強と考えられますが、ちょっといまいちになってきていると感じる傾向があります。
次世代候補:Gemini 2.0 Flash Experimental
次点でGoogleAIStudioのGemini 2.0 flash experimentalが注目に値します:
優位性:
- 圧倒的な速度: とにかく早い処理
- 高精度: 精度も高水準を維持
- 完全コード提示: ケチらずに全コードを速攻で提示
- 実用性: 本当にコピペでいける完成度
🚀 今後の展望と個人開発革命
技術共有とコミュニティ発展
次回はChrome拡張機能自体の話とリリースの流れを詳細に説明し、真似して好きな拡張機能をみんなが作ってくれれば、個人開発の時代が進んで楽しくなるというビジョンを実現したいと考えています。
AI駆動開発による社会変革
AI駆動開発で個人開発者が増えれば、世界は変わるという信念のもと、技術の民主化と個人の創造力解放を目指しています。
📊 実例・証拠
🎬 開発成果の実証
- YoutubeTranscriptCopier: Chrome拡張機能として実際にリリース
- プロンプト機能: 「プロンプト+文字起こし」統合コピー実装
- 多言語対応: 英語・日本語・中国語の3言語テンプレート提供
- Chrome Web Store: 一般公開による実用性証明
💡 効率化効果の定量化
- 従来6段階手順: YouTube→概要欄→文字起こし表示→選択→コピー→LLM→プロンプト追加
- 拡張機能1クリック: 文字起こし取得とプロンプト統合の自動化
- 時間短縮効果: 特に長時間動画での選択作業大幅削減
🤖 Cody評価の客観性
- 月額9ドル: 他AI開発ツールとの価格比較での優位性実証
- Claude 3.5 Sonnet: 使い放題による開発効率向上
- apply機能問題: 実際の開発経験に基づく課題指摘
🔬 AI モデル比較の実証
- Claude 3.5 Sonnet: プログラミング最強だが品質低下傾向
- Gemini 2.0 flash experimental: 高速・高精度・完全コード提示の実証
- 実用性検証: コピペで動作する完成度の確認
🚀 個人開発促進の意義
- 自己保守性: アップデート対応を自分で実行可能
- 課金問題回避: 既存サービスの課金制移行リスク排除
- 技術共有: 開発プロセス公開による知識の民主化
❓ 派生する問い
- AI駆動開発ツールの進化が、個人開発者と企業開発チームの生産性格差にどのような影響を与えるか?
- Chrome拡張機能開発における自作vs既存サービス利用の判断基準と長期的なコスト効果は?
- Gemini 2.0 flash experimentalの高速・高精度が、AI開発ツール市場の競争構造をどう変えるか?
🏷️ タグ
- note
- Cody
- AI駆動開発
- Chrome拡張機能
- 開発ツール
- AI
- プログラミング
- YouTube
- 文字起こし
- 個人開発
- Claude 3.5 Sonnet
- Gemini 2.0
- 効率化